본문 바로가기

심리통계학

심리학 연구에서 다중회귀분석과 로지스틱회귀분석

두 가지 논문을 소개하며, 다중회귀분석과 로지스틱회귀분석을 사용하는 예시를 알아보겠다.

 

1. 고등학생의 외상 후 울분장애와 우울, ADHD, 스마트폰 중독, 충동성, 자아존중감, 외상 사건 간의 관계(김동민 2022)

2. 비자살적 자해에 영향을 미치는 복합외상 및 복합외상증후군의 탐색(서윤아 2014)

 

 첫 번째 논문은 고등학생 500명을 대상으로,  우울, ADHD,스마트폰 중독, 충동성, 자아존중감, 외상사건, 총 6가지 독립변인이  종속변인인 울분장애에 영향에 미치는지 찾아보고자했다. 모두 연속적인 점수로 측정할 수 있는 척도지를 사용한 양적연구에 속한다. 사용된 통계 방법은  빈도 및 기술통계, 상관분석 및 일변량분석, 위계적 중다회귀분석을 실시하였다.

 

앞서 다중회귀분석에 포스팅을 했을 떄, 

https://321fsdw.tistory.com/49

 

다중회귀분석(Multiple Regression Analysis)

https://321fsdw.tistory.com/48 단순회귀분석(Simple Linear Regression)상관계수는 두 변수 간의 선형적 관계만을 검증하는 데 그치지만, 회귀분석은 독립변수와 종속변수를 설정하여 이 둘의 인과관계를 분

321fsdw.tistory.com

  입력선택방법이 6가지가 있다고 했다. 전진선택, 후진제거, 단계선택법,입력방법은 spss에서 사용이 가능하고,  공선성 문제를 해결하기위해서는 RIDGE, LASSO 방법을 사용하는데, 이 방법은 R에서 실행할 수 있다고 하였다.

 

  하지만 해당 연구에서는 위계적 다중회귀분석을 사용하였다. 이 말인즉슨, 위의 6가지 통계적방법을 사용한 것이 아닌, 연구자가 임의로 변수를 추가했다는 뜻이다. 그렇다고 마구잡이로 집어넣는 것은 아니고, 변수 선택 과정에 있어 연구자의 이론적 근거에 의해, 연구자가 정의한 순서에 따라 추가했다는 것을 의미한다. 주로 이론의 타당성과 가설의 검증이 필요할 때 사용한다.

 

 

다음은 준거변인(종속변인)인 외상 후 울분장애의 척도이다. 1~19가지 문항으로 구성되어있고 0점부터 4점까지 5가지를 선택할 수 있는 리커트척도로 평가되며, 0~76점으로 측정할 수 있는 연속적 척도로 구성되어있다.

 

 

 

두 번째 논문은 로지스틱회귀분석을 사용하였다. 대학생을 대상으로 우울증상을 통제한 상태에서, 일반적인특성, 복합외상경험, 복합외상증후군이 비자살성 자해의 여부를 확인하였다.  마찬가지로, 모두 연속적인 점수로 측정할 수 있는 척도지를 사용한 양적연구에 속한다. 다만 비자살성 자해를 측정하는 척도에서 예/아니오로 나뉜다.

 

해당 척도는 타당화 과정을 거치지 않았으며, 번안과 역번역 과정을 통해 제작된 것이다. 보통 타당화된 척도만 사용한다고 생각했는데, 이러한 방식도 가능하다는 점을 이번에 새롭게 알게 되었다. 또한, 16번 문항인 "몸에 난 상처를 치료하지 않고 내버려둔 적이 있습니까"를 제외한 것은 적절하다고 생각한다. 예를 들어, 나 역시 면도 중에 생긴 작은 상처는 심각하지 않다면 굳이 치료하지 않고 그냥 두는 경우가 많기 때문이다.  그런 경우를 생각하면 당연히 아니오를 체크할 것이다.

 

해당 척도는 예/아니오로 응답하게 되어 있다. 여기에서 하나라도 "예"를 체크한다면 2로 코딩되며, 모든 문항에서 "아니오"를 선택했다면 1으로 코딩된다. 따라서 이러한 방식으로 생성된 변수가 로지스틱 회귀분석의 준거변인(종속변수)으로 적합하다.

 

  정리하자면, 이 두 논문은 연구의 기본 목적이 매우 유사하다. 어떤 예측변인(독립변수)이 준거변인(종속변수)에 영향을 미치는지를 탐구한다는 점에서 공통적이다. 그러나 종속변인에서 결정적인 차이가 있다. 울분장애 연구에서는 다중회귀분석이 사용된 반면, 비자살성 자해 연구에서는 로지스틱 회귀분석이 활용되었다. 이러한 분석 방법의 차이는 종속변수를 측정하는 척도의 차이에 있다. 울분장애의 경우, 종속변수가 연속형 데이터로 측정되었기 때문에 다중회귀분석이 적절한 선택이었고, 반대로 비자살성 자해의 경우, 종속변수가 이분형 데이터(예/아니오)로 측정되어 로지스틱 회귀분석이 적합하게 사용되었다.

 

결론 - 사용되는 척도에 따라, 연구방법이 달라질 수 있다. 

반응형