BEHAVIORAL ECONOMICS

행복이 건강을 증진 시킬까? : 미국의 무작위 대조 실험

EDUNOMICS 2022. 6. 16. 19:54

 

2020년 2월 4일에 심리학 저널에 게재된 Does Happiness Improve Health? Evidence From a Randomized Controlled Trial 이라는 논문을 살펴보고자 한다. 

 

 

 

행복한 사람들이 더 건강하지만, 과연 행복해지는 것이 더 나은 건강으로 이어질까? Kostadin Kushlev, Samantha J. Heintzelman, Lesley D. Lutes, Derrick Wirtz, Jacqueline M. Kanippayoor, Damian Leitner, and Ed Diener 연구진들은 비임상 집단의 신체 건강에 대한 주관적 행복 (subjective well-beling) 증대의 영향을 조사하기 위한 실험 도구로서 포괄적인 연구와 3개월의 긍정적 심리 개입 (Positive Psychology Intervention) 을 도입했다. 한 지역의 성인 155명을 대상으로 6개월 동안 실시한 무작위 대조 실험에서, 연구진들은 질병통제예방센터의 행동 위험 요소 감시 시스템 설문조사에서 평가한 대로, 참가자들이 지난 달에 건강하거나 아프다고 느낀 일수- 즉, 자기 보고 신체 건강-의 치료 효과를 발견했다. 또한, 100명의 참가자를 대상으로 한 하위 표본에서, 연구진들은 프로그램 진행 중 주관적인 행복의 개선이 훗날의 병가 일수가 감소했다는 증거를 발견했다. 이번 연구는 실험적 방법론과 종단적 방법론을 결합하여, 자기 보고 신체 건강에 대한 주관적 행복의 인과적 영향에 대한 몇 가지 증거를 제공한다.


행복한 것은 기분이 좋지만, 행복의 혜택이 심리적 영역을 넘어 육체적 건강까지 포함할 수 있을건인가? 주관적 웰빙과 건강 사이의 연관성에 대한 증거는 주로 실험실에서 순간적인 기분을 활용하는 실험과 함께 단면적이고 전향적인 종적 연구에 뿌리를 두고 있다(Lyubomirsky, King, & Diener, 2005). 그러나 건강한 성인의 신체 건강에 대해 장기적으로 주관적 행복의 증가를 연구하는 것은 부족한 실정이다(Diener, Pressman, Hunter, Delgadillo-Chase, 2017). 아마도 이러한 외부 유효 실험 연구가 누락되었기 때문에, 신체적 건강 개선에 대한 행복 지속의 인과적 영향은 여전히 논쟁의 대상이 되었을지도 모른다(Liu et al., 2016). 이번 연구에서는 연구진들이 12주간의 긍정적 심리 개입 (Positive Psychology Intervention: 이하 PPI)을 실험 도구로 사용하여 기존 연구의 격차를 메우는 것을 목표로 했다.

 

행복과 건강사이의 연관성 

 

행복과 건강 사이의 연관성은 상관관계, 종적연구 및 실험적 증거에 의해 뒷받침된다(Lyubomirsky et al., 2005). 예를 들어, 더 행복한 사람은 더 나은 심혈관 건강(Boehm, Vie, & Kubzansky, 2012)과 면역 기능(Marsland, Cohen, Rabin, Manuck, 2006), 더 건강한 행동을 하고(Boehm et al., 2012), 더 오래 산다고 한다(Diener & Chan, 2011). 특히 주목할 만한 연구를 살펴보면, 22세 전후 수녀들이 쓴 자서전의 긍정적인 면은 75세부터 95세까지로 수녀들의 생존율을 예측했다(Danner, Snowdon, & Friesen, 2001). 이 광범위한 문헌을 종합한 메타 분석 증거는 주관적 행복이 건강 및 질병 샘플 모두에서 생존 증가(Chida & Steptoe, 2008), 단기 면역 기능, 통증 완화, 내분비 반응 및 장기 심혈관 건강뿐만 아니라 느린 질병 진행 (Howell, Kern, & Lyubomirsky, 2007) 과 환자 회복과 관련이 있음을 시사한다 (Lamers, Bolier, Westerhof, Smit, & Bolmeijer, 2012).

 

이러한 일관된 증거에도 불구하고, 행복의 건강상 이점에 대한 연구는 무작위 대조 실험(의학에서 gold standard로 간주됨)과 같은 장기적이고 유효하며 건강한 표본의 실험 증거가 상대적으로 부족하여 어려움을 겪고 있다. 실제로, 기존의 실험 결과는 주로 단기적이면서 긍정적이며, 생리 건강 지표에 대한 즉각적이고 단기적인 결과로 부터 나온다(Pressman & Cohen, 2005).

 

시간이 지남에 따라 주관적인 행복이 건강에 미치는 영향을 조사하는 소수의 연구들은 주로 특정한 건강 문제를 가진 집단에 초점을 맞추고 있다. 이러한 개입들 중 일부는 스트레스나 우울증과 같은 주관적인 불행을 완화하는 것과 2년 후 남성의 사망률을 감소시키고 (Linden, Phillips, & Leclerc, 2007), 향후 심장 질환 감소(Rutledge, Redwine, Linke, & Mills, 2013) 및 신체 건강의 개선(O'Neil, Sanderson, Oldenburg, Taylor, 2011) 등을 목표로 하고 있다. 다른 개입들은 주관적인 웰빙 증대에 더 직접적으로 초점을 맞췄지만, 이는 기존의 건강 문제가 있는 특정 임상 집단에서만 이루어졌다. 예를 들어, PPI (긍정적 심리 개입) 는 만성 심폐 질환 환자의 건강 행동 변화 (Charlson et al., 2014), 고혈압 아프리카계 미국인의 약물 치료(Ogedegbe et al., 2012), 관상동맥 관리 환자의 신체 활동 증가를 초래했다(Peterson et al., 2012).

 

집중적인 PPI는 임상 집단 내에서 건강 행동과 건강 지표를 개선하는 것으로 보이지만, 비임상 집단에서도 더 나은 건강으로 이어질수 있을까? 

 


연구방법 

참가자는 155명의 지역사회 성인(평균 연령= 45.36세, SD = 13.52세, 78% 여성) 중 55명(평균 연령 = 49.15세, SD = 11.91세, 75% 여성)은 브리티시 컬럼비아주 켈로나(Kelowna)에서 모집되었고, 28명의 의료진이 주도하는 주간 대면 그룹 세션(대기자 통제 집단: 28명, 처치(실험)집단: 27명)을 받았다. 나머지 100명 (평균 연령= 43.28세, SD = 13.95세, 80% 여성)은 버지니아주 샬로츠빌(Charlottesville)에서 모집되었고, 주간 온라인 세션(대기자 대조군: n = 50, 치료군: n = 50)을 받았다. 

 

모든 참가자는 기준평가를 마쳤으며 133명(85.8%)은 치료 종료 시 사후검사를 마쳤고 127명(81.9%)은 프로그램 완료 후 3개월 후에 후속평가를 마쳤다. 절차상의 흐름 때문에 켈로나에서 모집한 55명의 참가자의 주간 조사 데이터는 일치시킬 수 없었다. 따라서 주간 조사 데이터에 근거한 결과는 샬로츠빌에서 모집한 100명의 참가자를 기준으로 하였다.

 

참가자 모집 및 랜덤화 절차

 

연구진들은 광범위한 커뮤니티 샘플을 얻기 위해 소셜 미디어, 커뮤니티 전단, 신문 광고, 대학 직원에게 보내는 이메일, 지역 토크 라디오 인터뷰 등 다양한 광고 방법을 활용했다. 참여하고 싶은 사람(N = 462)들은 이메일이나 온라인 링크를 통해 관심을 나타냈고, 이 중 258명이 사전심사를 마쳤다. 참가자는 25세 미만, 75세 이상 또는 환자 건강 설문지-9(Patient Health Questionnaire-9)에서 15점 이상을 획득하며 중간 정도의 우울증 기준을 충족한 경우에는 실험에 참여할 자격이 없었다(PHQ-9; Kroenke, Spitzer, & Williams, 2001). 관심 있는 사람들 중 67명은 사전 검사를 완료하지 않았다; 사전 검사를 완료한 사람들 중 4명의 참가자는 연령적합 범위에서 벗어났고 15명의 참가자는 중간 정도의 우울증을 나타내는 증상을 보고했다(그리고 이들은 적절한 정신 건강 서비스에 의뢰되었다). 참가 자격이 있는 사람 중 17명은 참가하기를 거부하거나 참석하지 않아서 각 참가자들에게 실험에 관한 서류를 직접 전달했다. 나머지 개인들(n = 155)은 활성-유발 그룹(n = 77) 또는 대기 목록 대조군(n = 78)에 무작위로 할당되는 것을 포함하여 연구에 참여하기로 동의했다. 성별 조건과 중간 정도의 우울증이 있는 참가자 사이의 동등성을 보장하기 위해 계층화된 무작위화를 사용했다(PHQ-9 점수  ≥ 10). 

 

탈락 (Attrition) 

 

표1.Means, Standard Deviations, and Effect Sizes for Heath Measures at Each Assessment Point

 

표 1 에서는 종합적인 평가에 걸친 탈락 정보가 제시되어 있다. 베이스라인 평가에서 후속 평가까지의 6개월 동안의 탈락율은 18%였다. 온라인으로 치료를 받은 참가자의 탈락율은 16%로 일반적으로 온라인 개입에서 관찰되는 것보다 훨씬 낮았다. 일부 참가자가 온라인으로 프로그램 모듈을 완료했지만, 모든 참가자는 지역 커뮤니티에서 모집되어 몇 번의 소개 세션에서 치료 프로그램과 연구팀을 소개받았으며, 연구실에서 모든 주요 평가를 완료했다. 또한, 모든 참가자는, 프로그램 모듈을 완료하기 위해 개인적으로 이메일이나 전화를 통해 스케줄을 설정하는 것을 상기시켜주었다. 치료 전반에 걸친 주간 조사의 미완료 정보는 표 2에 나와 있다. 참가자들은 치료 기간 동안 실시한 주간 온라인 설문 조사 10건 중 평균 7.7건을 완료했다. 전반적으로 만족스럽지만, 이 완료율은 조건에 따라 달랐다. 대조군 참가자는 평균 10건 중 8.9건을 완료했지만 치료 참여자는 10건 중 6.4건을 완료했다. 이러한 차이를 설명할 수 있는 무작위 할당 실패 가능성을 조사하기 위해 기준에서 그룹 간에 추가 비교를 실행했다.

 

표2. Person-Level Descriptive Statistics and Treatment Effects for the Weekly Measure of Sick Days

 

연구진들은 주요 인구 통계에서 유의미한 차이를 발견하지 못했다. 연령: t(98) = -1.63, p = .106; 성별: t(96) = 0.59, p > .250; 교육: t(98) = -0.10, p > .250; 소득은 예외적으로 처치집단(Treatment Group)이 통제집단(Control Group) 보두 더 높은 소득을 얻었다. 두 그룹은 t(95) = -0.98, p > .250 로 부동산, 투자 및 기타 자산을 포함한 전반적인 재산에서 차이가 없었다. 또한 그룹들은 스트레스 t(98) = 1.51, p = .134, 우울증 t(98) = 0.07, p > .250과 같은 다른 곳에서도 차이가 없었다. 또한, 연구진들은 지난 달 기준에서 (a) 사람들이 아프다고 느꼈고, t(98) = 0.81, p > .250, (b) 신체 건강에 영향을 미쳤으며, t(98) = 1.23, p = .221, 또는 (c) 사람들이 건강하고 에너지가 가득하다고 느꼈다는 것,  t(98) = 0.21, p > .250.을 발견하지 못했다. 따라서 랜덤 할당의 실패를 시사하는 증거를 찾지 못했다.

 

또한, 연구진들은 지난 주(10주차) 설문조사를 실시한 사람과 주요 관련 결과에 대해 조사하지 않은 사람을 비교했다. 이에 대해 설문조사 완료자와 조사하지 않은 사람 사이에 베이스라인에서의 차이점은 없었다. [스트레스, t(98) = 0.37, p > .250, 우울증, t(98) = 1.33, p = .187 또는 (a) 그들이 아프다고 느낀 전달의 일수, t(98) = -0.26, p > .250, (b) 신체 건강의 영향 t(98) = -1.17, p = .246. (c) 사람들이 건강하고 에너지가 가득하다고 느끼는 것  t(98) = −1.17, p = .246.] 그러나 여전히 주간 설문조사 측정에 대한 분석은 신중하게 해석할 필요가 있다.

 

 

처치 집단 (Treatment group)

 

연구진들은 포괄적인 12주간의 PPI:  행복 지구력과 지속적인 자기 강화(ENHANCE)를 시도했다. ENHANCE는 10주간의 모듈, 즉 행복의 원칙을 특징으로 한다. 프로그램 모듈은 훈련을 받은 임상의가 주도하는 대면 그룹 세션에서 관리하거나 맞춤형 웹 플랫폼을 통해 자체 관리할 수 있다.

ENHANCE는 자기 확인, 마음가짐, 감사, 긍정적인 사회적 상호작용, 친사회적 행동 등 보다 주관적인 행복과 관련된 광범위한 활동과 기술을 포함하는 포괄적인 PPI이다(Quoidbach et al., 2015). 경험적으로 지원되는 다양한 활동을 특징으로 하는 프로그램을 만드는 것이 ENCHANCE를 개념화하는데 중요한 이론적 동기였다. 실제로, 기존 연구와 이론에 따르면 활동 다양성은 쾌락적 적응과 맞서고(Sheldon & Lyubomirsky, 2012), 사람-활동 적합의 기회를 극대화한다(Schueler, 2010). 각 주간 모듈은 (a) 온라인 또는 대면 그룹 세션에서 관리된 1시간 분량의 수업과 함께 목표 행복 원칙에 대한 정보와 연습, (b) 주간 쓰기 과제(예: 감사 일지 쓰기, 자신의 가치에 대한 쓰기) 및 (c) 일상생활에서 원칙을 통합하고 적용하기 위한 능동적 행동 구성 요소를 특징(예: 안내된 명상, 감사편지 보내기)으로 했다. 

프로그램 모듈은 시간이 지남에 따라 주관적인 웰빙의 점진적인 증가를 생성하기 위해 서로 구축 및 확장되도록 구성되었다. 프로그램의 첫 번째 섹션인 The Core Self(모듈 1-3)는 가치 확인, 목표 추구 및 성격 강점에 초점을 맞춘 활동을 포함하여 자기 발견과 미래 계획을 목표로 했다. 두 번째 섹션인 경험적 자아(모듈 4-6)는 참가자들이 외부 세계를 경험하는 방식과 마음가짐, 자기 연민, 음미 등을 포함한 그들의 내부 감정을 다루었다. 마지막으로, 세 번째 섹션인 The Social Self (Modules 7-10)는 강하고 약한 사회적 유대관계와 긍정적인 상호작용을 촉진하고 친사회적 행동을 하는 것을 포함하여 건강한 사회생활을 구축하고 유지하는 것을 포함했다.

 

매주 평가

참가자들은 10주마다 간단한 온라인 설문조사를 통해 얻은 건강과 웰빙에 대한 주간 보고서를 작성했다. 치료 참가자와 대조군 참가자 모두 치료 그룹을 위한 새로운 주간 모듈의 발표와 동시에 일요일에 주간 조사를 받았다. 치료 참가자들은 이번 주 모듈을 시작하기 전에 이전 주부터 설문조사를 완료하도록 지시받았다.

각 주간 평가에는 "지난 1주일 동안" 긍정적 및 부정적 영향을 측정하기 위한 긍정 및 부정적 경험 척도(SPANE; Diener et al., 2010)가 포함되었다. 또, 참가자는, 「지난 1주간은 생활 만족도」와 「생활의 의미」(지난 1주간은, 어느 정도 삶의 의미와 목적을 느꼈습니까?)의 단일 항목을 완성했다.; 이 측정들은 연구진들의 PPI가 주관적인 웰빙을 성공적으로 개선했는지 확인하기 위해이번 연구에서 조작 검사로 사용되었다. 사람-활동 적합성 등 본 문서의 범위를 벗어난 다른 조치도 포함되었다(Kushlev et al., 2017).

 

매주 Behavioral Risk Factor Surveillance System(BRFSS; Centers for Disease Control and Prevention, 2014)의 항목을 건강의 주요 척도로 사용했다. "지난 일주일 동안 신체적인 질병과 부상을 포함한 신체 건강에 대해 생각해 보니 신체 건강이 얼마나 나빴습니까?" (표 2 참조) 이 항목은 폭(즉, 특정 건강 상태에 초점을 맞추지 않음)과 특수성(즉, 특정 기간 및 최근 기간 내의 신체적 건강 증상을 명확하게 정의함)을 결합한다.

 

포괄적인 평가


자기 보고 건강 지표


치료 기간 동안 매주 간단한 평가를 완료할 뿐만 아니라, 참가자들은 무작위 할당 전에 더 큰 기준 평가를 완료했으며, 3개월 후 테스트(중재 직후)와 6개월 후 후속 조치(중재 종료 후 3개월 후)에서 동일한 평가를 완료했다. 이러한 평가에는 (a) 참가자들이 아프다고 느낀 지난달의 일수, (b) 그들의 건강으로 인해 일상적인 활동을 방해받은 일수, (c) 건강하고 에너지가 가득하다고 느낀 BRFSS의 항목이 포함되었다(기술 통계는 표 1 참조).

건강의 객관적 지표


자가 보고 건강 지표 수집 외에도, 연구진들은 세 가지 종합 평가 각각에서 건강의 기본 객관적 지표(수축기 혈압, 확장기 혈압, 체중)를 얻었다. 각 평가에서 혈압을 두 번 측정하여 두 측정에서 평균 수축기 혈압과 확장기 혈압을 계산했다. 각 평가에서 체중을 사용하여 베이스라인에서 측정된 키를 기준으로 체질량 지수(BMI)를 계산했다. 연구진들은 그러한 객관적 측정치를 건강의 연속적인 지표로 취급했다(기술 통계는 표 1 참조).

 

 

힘과 중요성

 

가설 검증 유의성 테스트에 NeymanPearson 접근방식을 사용했다(α = 0.05). 동일한 가설을 테스트하기 위해 여러 결과를 검사했기 때문에 각 결과에 대한 임계 p 값을 조정하여 family-wise error rate (FWER)을 0.05보다 작게 유지했다. 연구진들은 연구 측정을 두 개의 가족으로 분류했다. (a) 치료 전, 치료 중, 치료 후 자가 보고 질문으로 측정한 신체 건강의 네 가지 주요 주관적 측정치 및 (b) 치료 전후에 측정한 건강의 세 가지 보조 목표 측정치(BMI, 수축기 혈압, 확장기 혈압) 보수적으로 하기 위해, 연구진들은 자기 보고 BRFSS 질문에 대한 주간 평가와 포괄적인 평가를 구분하지 않았다. 관측된 p 값이 크기별로 가장 큰 것부터 가장 작은 것 순으로 정렬되는 FWER(Holm, 1979)을 제어하는 Holm-Bonferroni 스텝다운 방법을 선택했다. 그런 다음 가장 작은 p는 p/m(여기서 m은 총 비교 수)로 조정되고 다음으로 작은 p 값은 p/(m - 1)로 조정되었다. 가설을 p 값이 가장 작은 결과부터 유의미한 검정에 도달할 때까지 순차적으로 테스트하였고, 테스트되지 않은 모든 결과에 대한 영향은 유의하지 않은 것으로 간주하였다. 이 접근방식을 선택한 이유는 고전적인 Bonferroni 방식보다 전력을 더 잘 유지하면서 FWER에 대한 강력하고 보수적인 제어를 제공하기 때문이다. 

연구진들은 설계 및 근거 (design-and-rationale)의 연구에서 80%의 검정력으로 0.4의 효과 크기 d를 검출하는 계획을 사전 등록했다(Kushlev et al., 2017). R의 패키지 powerlmm(버전 0.4.0; Magnusson, 2018)를 사용하여 2단계 혼합 설계에 대한 전력을 추정했으며, 관찰 수(3 대 10), 참가자 수(155 대 100), 평가(3개월 대 1주일), 측정 척도(0~30일 대 0~7일) 에서 각 방법의 차이를 반영하기 위해 종합 및 주간 평가에 대해 서로 다른 모델 매개변수를 지정했다. 세 가지 포괄적인 평가의 경우, 155명의 참가자당 3개의 측정치를 피험자 수준의 무작위 절편 1.5와 피험자 내 잔차 0.5로 지정했다. 기울기당 시점이 3개밖에 없기 때문에 랜덤 기울기 값을 0으로 제한했으며, 4개의 결과 중 가족에 대한 알파 레벨이 가장 보수적인 Holm 조정으로 α/4 of .0125라는 점을 고려하면 사전 등록된 d(0.4) 이상의 효과를 검출할 수 있는 99% 이상의 힘을 가질 것으로 추정했다 (여기서 d는 마지막 측정 시 효과 크기로, 기준선에서 결과 변수의 표준 편차를 기반으로 표준화됨). 0.2의 작은 d의 경우 0.0125의 α/4에서 60%, 0.0167의 α/3에서 64%, 0.025의 α/2에서 70%, 0.05의 α에서 79%의 전력을 얻었다.

 

주간 평가의 경우, 100명의 참가자당 10개의 측정치를 피험자 수준의 랜덤 절편 1, 피험자 수준의 랜덤 기울기 0.01 및 피험자 내 잔차 1로 지정했다. 사전 등록된 d가 0.4인 경우, 0.0125의 α/4에서 62%, 0.0167의 α/3에서 66%, α/2의 α/2에서 71%, α의 α에서 0.05의 α에서 80%의 파워를 가지고 있음을 발견했다. 0.2의 작은 d의 경우, 0.0125의 α/4에서 14%, 0.0167의 α/3에서 16%, 0.025의 α/2에서 20%, α의 α에서 29%의 파워를 가졌다. 0.5의 중간 d의 경우, 0.0125의 α/4에서 84%, 0.0167의 α/3에서 87%, 0.025의 α/2에서 90%, α에서 94%의 파워를 가졌다.

 


연구결과

 

매주 평가: 치료 과정 전체에 미치는 영향

분석 전략

 

 

표3 Fixed Components From the Growth Models for the Number of Weekly Sick Days Throughout the Course of Treatment

 

표4. Random Components From the Growth Models for the Number of Weekly Sick Days Throughout the Course of Treatment


치료 기간에 대한 주간 평가를 위해 다단계 성장 모델을 사용하여 치료의 시간이 경과함에 따른 결과를 추정했다. 따라서 시간(피실험자 내 1 수준)과 치료(피실험자 간 2 수준) 사이의 고정 효과 상호작용으로 나타나는 시간 경과에 따른 변화를 비교했다. 병가의 랜덤 절편과 시간의 랜덤 효과를 모델링하여 각 참가자의 시간 경과 점수를 관찰한 대로 모델링할 수 있도록 했다. 고정 효과가 일차적 관심사였기 때문에, 무작위 절편과 기울기 사이의 공분산은 절약성과 모델 간의 직접 비교를 위해 제한되었다(표 3과 4 참조). 이 분석적 결정은 효과 크기 추정치에 무시할 만한 영향을 미쳤다. 해석의 용이성을 위해 시간은 -9주(1주차)에서 0주(10주차)까지 코드화되어 모델 절편이 10주차 개입 후 평균 차이로 해석되고 처리 계수가 10주차(표 3 및 4) 치료의 즉각적인 효과로 해석될 수 있었다. 

 

관측된 병가 일수는 이론적인 포아송 분포에 정규 분포보다 훨씬 적합하다(그림 = 0.84). 따라서 병가를 예측하는 혼합 모델에 대해 포아송 분포를 지정했다. 포아송 분포는 비사건 발생률이 높은 비정규 분포 빈도 결과(즉, 증상이 없는 날; Bolker et al., 2009)에 매우 적합하다.

효과 크기의 표준 측정을 제공하기 위해 혼합 모델에 대한 Wald t 테스트에서 Cohen의 ds를 역계산했다. 따라서 모형 효과 크기는 처리 과정의 전반적인 조건 효과 크기를 나타낸다. 보충 자료에서는 각 결과에 대한 주별 코헨의 ds를 추가로 제공한다. 코헨의 d 효과 크기(및 Wald t 검정)는 정규 분포를 가정하기 때문에 병일 수에 대한 발생률 비율(IRR)도 계산했다. 병가 발생률은 원래 지표로 직접 해석할 수 있는 표준 효과 크기 측정을 제공한다.

조작 체크: 주관적인 웰빙

 

표1.Effect of treatment and no treatment on three indicators of subjective well-being (life satisfaction, positive affect, and negative affect) over time. The x-axis represents each survey administered after each weekly program module. Dots are group means, and error bars are standard deviations. Slopes show best-fitting regressions, and the gray bands represent standard errors of the mean.

 

첫째, 연구진들은 심리개입이 치료 과정 동안 시간이 지남에 따라 주관적인 행복에 예상되는 변화를 발생시켰는지 여부를 조사했다. 삶의 만족도에 대한 유의한 치료 × 시간 상호작용, b = 0.08, SE = 0.02, β = 0.27, t(666) = 3.98, p < .001, d = 0.31, R2 = 0.03, 양성 영향, b = 0.05, SE = 0.02, t(1902)를 발견했다. 그림 1에서 볼 수 있듯이, 실험 참가자들은 자신의 삶에 대해 더 만족하게 되었고 치료 과정 내내 긍정적인 영향이 점점 더 높아지고 부정적인 영향이 더 낮다고 보고한 반면 대조군 참가자들은 거의 변화를 경험하지 못했다. 또한 치료는 대조군 조건과 비교하여 참가자들의 삶의 의미를 증가시켰다. b = 0.05, SE = 0.02, β = 0.15, t(667) = 2.48, p = 0.013, d = 0.45, R2 = 0.02.

그림2 Effect of treatment and no treatment on the number of sick days over the course of treatment. The x-axis represents each survey administered after each weekly program module. Dots are group means, and error bars are standard deviations. Slopes show bestfitting regressions, and the gray bands represent standard errors of the mean

 

보고된 신체 상태

 

조건부 성장 모델은 IRR = 0.91, d = -0.32, p = 0.042, pHolm-Bonferroni = 0.042, pHolm-Bonferroni = 0.042의 병가 일수에 대해 유의한 치료 × 시간 상호작용을 나타냈다. 특히, 치료 조건의 사람들은 연구 과정에서 상당히 낮은 질병률을 경험했다(그림 2). 10주 동안 치료의 순간적 효과는 0.35, 95% 신뢰 구간(CI) = [0.18, 0.71]이었고, 이는 치료 참가자가 치료 종료 시 병가 발생률의 1/3에 불과했음을 시사한다. 표 2에서는 조건 간 표준화된 평균 차이로 정량화된 10주차 치료의 동일한 효과를 추가로 보여준다(d = -0.35).

진단 분석 결과 결과 변수에 특이치가 있는 것으로 나타났다. 일주일에 6일 동안 아픈 것을 포함한 관측치는 0.5%에 불과했고, 7일 내내 아픈 것을 포함한 관측치는 2.1%에 불과했다. 6일과 7일을 5일로 재코딩하면 포아송 분포에 더 잘 적합하는 것으로 나타났으며 시뮬레이션 기반 축척 잔차 그림은 포아송 혼합 선형 모형에서 변환 변수를 사용하면 잔차 분포에 대한 가정을 더 잘 만족하는 것으로 나타났다. 특이치를 제외한 변환된 결과 변수로 데이터를 재분석하여 이러한 조정이 효과에 영향을 미치는지 조사했다(모델 세부 사항은 표 3과 4 참조). 변형된 병가 일수에 대한 치료 × 시간 상호작용은 효과 크기(IRR = 0.91, p = 0.032, pHolm-Bonferroni = 0.032)에 아무런 변화 없이 유의하게 유지되었으며, IRR = 0.36, 95% CI = [0.18,071]의 10주 동안 치료의 즉각적인 효과가 있었다.

효과 크기

 

조건부 성장 모델에 대한 효과 크기의 단일 표준 측정치가 없기 때문에 몇 가지 추가 효과 크기 측정치를 추정했다. 모든 효과 크기 측도는 원래 변환되지 않은 변수(특이치 포함)에 대해 추정되었다. 효과 크기를 정량화하는 한 가지 방법은 전체 주에 걸쳐 평균화된 조건 간의 표준화된 평균 차이를 계산하는 것이다. 표 2에서 이 효과(d = -0.18)가 치료 × 시간 효과 및 마지막 주 효과보다 다소 작음을 알 수 있다. 이러한 패턴은 치료의 효과가 즉각적이지 않고 오히려 PPI의 과정에 걸쳐 축적되었음을 시사한다. 실제로 주관적인 웰빙과 마찬가지로, 주별 비교에서는 5주차 이후에만 유의적인 차이가 나타났다.

 

주관적인 웰빙이 주관적인 건강의 차이를 설명해 주는가?

 

데이터의 종적인 특성을 이용하여 주관적 웰빙의 주별 변화가 주관적 건강의 차이를 예측하는지 여부를 조사했다. 연구진들은 지난 주 동안 병가를 통제하면서 해당 주와 전 주 사이의 주관적 행복의 차이에서 특정 주의 병가를 예측하는 시간 지연 상관 분석을 실행했다. 1주차 응답을 유지하기 위해 보수적으로 0주차(기준)부터 웰빙이 증가하지 않는다고 가정했다. 지난 주보다 더 오래 아팠을 경우(IRR > 1.45, 95% CI = [1.36, 1.55], z = 10.98, p <.001, R2 = .16), 주간 긍정적인 영향의 변화, IRR = 0.75, 95% CI = [0.66, 085, p = 4z42)0.75, 0.91], z = -3.83, p < .001, R2 = 0.02는 이번 주에 사람들이 얼마나 아팠는지를 유의하게 예측했다. 삶의 의미 변화는 이러한 분석에서 병가를 유의하게 예측하지 않았다. IRR = 0.91, 95% CI = [0.80, 1.03], z = -1.46, p = .diples, R2 = 0.01. 이는 치료가 운동과 같은 건강 행동을 대상으로 하지 않았다는 점을 감안할 때, 연구진들이 관찰한 치료 효과가 최소한의 주관적인 웰빙 증진을 위한 심리 개입의 효과에 의해 설명되는 부분이라고 할 수 있다. 

 

 

포괄적인 평가 : 건강에 대한 치료 효과가 지속되는가? 

 

자기 보고 건강

 

그림 3. Rain plots of three subjective health indicators (number of days of feeling sick, number of days sickness prevented activity, and number of days of feeling healthy) at baseline, after treatment, and at follow-up 3 months after treatment, separately for the control and treatment groups. Dots indicate individual data points. The top and bottom of each box indicate the 75th and 25th percentile, respectively. The horizontal line in each box indicates the group median, and the whiskers represent values within 1.5 times the interquartile range from the upper and lower quartiles. The wavy plots to the right of each box indicate the density of the data

 

다음으로 기준에서 후속 조치(즉, 개입 후 최대 3개월)에 이르는 포괄적인 평가에서 건강 결과의 변화를 탐색했다. 주간 측정과 마찬가지로 포아송 분포의 다단계 성장 모델을 사용하여 옴니버스 효과를 테스트했다. 그러나 이러한 결과 변수의 반복 관측치 수가 적기 때문에 모형 비융합을 방지하기 위해 랜덤 기울기를 0으로 제한했다. 전반적으로, 기준에서 후속 조치까지, 치료 참가자는 지난 달 동안 IRR = 0.81, p = .0008, pHolm-Bonferroni = .0025, d = -0.12일 또는 건강이 일상 활동을 방해한 날, IRR = 0.79, p = .0016, pHolm-Bonferroni = .0032, d = −0.09 을 대조군 참가자보다 덜 경험했다. 치료 참가자는 또한 건강하고 에너지가 넘치는 날을 느낄 확률이 1/5 더 높았다. IRR = 1.15, p = .00001, pHolm-Bonferroni = .00008, d = 0.39 (기술 통계 및 효과 크기는 표 1 그림 3 참조) 

 

객관적인 건강

 

그림 4. Rain plots of three objective health indicators (body mass index, systolic blood pressure, and diastolic blood pressure) at baseline, after treatment, and at follow-up 3 months after treatment, separately for individuals in the control and treatment groups. Dots indicate individual data points. The top and bottom of each box indicate the 75th and 25th percentile, respectively. The horizontal line in each box indicates the group median, and the whiskers represent values within 1.5 times the interquartile range from the upper and lower quartiles. The wavy plots to the right of each box indicate the density of the data.

 

자가 보고 조치 외에도, 세 가지 종합 평가에서 각각 혈압과 BMI라는 기본적인 객관적 건강 측정치를 얻었다(기술 통계와 효과 크기는 표 1과 그림 4에 표시). 연구진들은 가우스 분포를 가진 성장 혼합 모델을 지정했다. 연구진들은 BMI, b = −0.16, SE = 0.09, t(229) = −1.77, d = −0.23, p = .079, pHolm-Bonferroni = .236; 수축기 혈압, b = −0.73, SE = 1.33, t(232) = −0.55, d = −0.07, p > .250, pHolm-Bonferroni = 1; or 이완기 혈압, b = −0.40, SE = 0.77, t(231) = −0.53, d = −0.07, p > .250, pHolm-Bonferroni = 1 에서 시간에 따른 치료 효과를 찾지 못했으며, PPI가 객관적인 건강 결과에 어떤 영향을 미친다는 증거를 찾지 못했다. 


무작위 대조 실험에서, 연구진들은 주관적인 행복을 증진시키기 위해 특별히 고안된 심리적 개입이 자가 보고 신체 건강에 영향을 미친다는 증거를 발견했다. 또한 프로그램을 진행하면서, 치료 참가자들은 대조군 참가자들에 비해 주관적인 행복 수준이 증가했다고 보고했다. 치료 과정 동안 주관적인 행복의 주별 (weekly) 변화는 차례로 참가자들이 보고한 병가 일수의 후속 변화를 예측했다. 또한, 치료 종료 후 3개월까지 기준선에서부터 PPI 참여자들은 몸이 아프거나 건강이 정상적인 활동에 지장을 주는 날이 적다고 보고했다. 이러한 발견들은 주관적인 행복이 증가하는 것이 사람들을 더 건강하게 느끼게 할 수 있다는 것을 암시한다. 그러나 연구진들은 주관적인 웰빙을 증진시키기 위한 치료가 BMI와 혈압을 포함한 건강의 객관적인 지표에 어떠한 영향도 미친다는 증거를 발견하지 못했다. 따라서, 이번 연구는 문헌의 중요한 격차를 메우는 데 도움을 주면서, 임상 과학의 모범 사례를 사용하는 보다 전향적인 무작위 시험의 필요성을 더욱 강조한다. 중요한 다음 단계는 연구진의 연구 결과가 능동적 대조군을 사용하여 복제되고 확장될 수 있는지 확인하는 것이며, 따라서 연구진들이 대기 그룹 제어 설계에 내재된 가능한 위약 효과와 수요 특성을 제어하는 것이다. 

 

연구진들은 참가자들이 건강하거나 아프다고 느낀 일수에 대한 PPI의 영향을 발견했지만 체중과 혈압을 포함한 건강의 생리적인 지표에는 영향을 미치지 않았다. 이러한 발견 패턴은 주관적 웰빙이 더 나은 면역 기능을 예측한다는 것을 보여준 과거 연구의 패턴과 일치한다(Cohen et al., 2006; Marsland et al., 2006). 반대로 주관적 웰빙이 단기적으로 체중이나 심혈관 건강에 영향을 미친다는 것을 암시하는 증거는 비교적 적다 (Diener et al., 2017; Howell et al., 2007). 실제로, 객관적인 건강 지표인 혈압과 BMI는 건강 관련 생리적 지표와 더 높은 주관적 행복 사이의 연관성에 대한 기존 증거보다는 측정의 용이성과 저렴성 때문에 선택되었다. 따라서 현재 연구에 대한 후속 작업 구축에는 면역 기능, 내분비 반응, 염증 또는 상처 치유 지표와 같이 과거 연구에서 웰빙과 더 강하게 연계된 건강의 객관적인 생리 지표를 포함해야 한다(Diener et al., 2017). 의료 방문 정보 및 사망 연령과 같은 추가 객관적 지표도 향후 연구에서 수집할 수 있다. 의학 및 심리 연구자 간의 협업이 건강에 대한 더 나은 객관적인 척도를 제공하는 데 특히 효과적일 수 있다.


이와 관련, 신체적 건강의 변화는 종종 시간이 지남에 따라 천천히 전개되기 때문에(Howell et al., 2007), 향후 연구는 생리학적 건강 지표의 평가를 수개월에서 수년으로 확장해야 한다. 이러한 종적 연구는 몸과 마음의 연결에 대한 오랜 이론적 질문에 답하는 데 도움이 될 것이다. PPI가 긍정적인 피드백 루프를 통해 수명 전반에 걸쳐 건강에 누적적인 영향을 미칠 수 있는가(Fredrickson & Losada, 2005)? PPI에 관여하는 라이프 스테이지(어린 시절, 청년기 또는 중년기)는 평생에 걸쳐 건강에 미치는 영향을 완화할 수 있을까? 비록 자녀 교육 커리큘럼의 일부로서 조기 개입이 평생 동안 복합적인 건강 혜택을 위해 올바른 길을 걷게 할 수 있지만, 중년에 그러한 개입을 하는 것은 더 큰 헌신이 필요할 수도 있다.

 

마지막으로, 무작위 제어 시험 설계를 채택한 연구진들의 목표는 시간에 따른 주관적 행복의 의미 있는 증가가 신체적 건강 결과에 대한 다운스트림 결과를 가져올 수 있는지를 조사하는 것이었다. 그러나 포괄적 심리 개입의 무작위화된 통제된 시행의 본질적인 문제는 개입의 다중 모달 성격이 세 번째 변수 문제를 발생시킨다는 것이다. 다시 말해, 개입에 의해 목표로 된 기술 중 어떤 것이든 주관적인 웰빙에 직접적인 영향을 주고 동시에 건강 결과에 직접적인 영향을 줄 수 있다. 능동 제어 조건을 사용하는 설계도 가능한 모든 교란 변수를 적절히 다룰 수 없었다. 물론 잘 통제된 실험실 환경만이 격리된 요인을 조작함으로써 명확한 인과관계를 확립할 수 있다. 무작위 제어 시험 설계의 주된 기여는 건강에 대한 주관적 웰빙의 인과적 영향에 대한 기존 문헌에 지배적인 증거를 추가하는 것이다. 이는 간단한 실험실 조작이나 조작이 없는 종적 연구에서 정확하게 도출된다(Diener et al., 2017).

 

 

 

 

 

 

 

 

 

 

Kushlev K, Heintzelman SJ, Lutes LD, Wirtz D, Kanippayoor JM, Leitner D, Diener E. Does Happiness Improve Health? Evidence From a Randomized Controlled Trial. Psychol Sci. 2020 Jul;31(7):807-821. doi: 10.1177/0956797620919673. Epub 2020 Jun 24. PMID: 32579432.