• 서울시 마포구 도화동 347-39 예당빌딩 4층
  • 월~금요일 9:00 - 18:00
  • 02-887-7077

1. 분산분석 개요

    분산분석 목적 및 설문 구성

      목적

      • 세집단 이상의 평균 간 차이를 검증하는데 이용되는 방법
      • 독립변수: 3개 이상의 집단으로 구성된 범주형 자료(연령대 등)
      • 종족변수: 평균을 산출할 수 있는 수치형 자료 (성적, 만족도 등)
      • 독립변수의 수에 따라 일원분산분석과 이원분산 분석으로

      설문구성의 예

      • 귀하의 연령대는?

        (1) 10대 (2) 20대 (3) 30대 (4) 40대이상

      • 귀하 가정의 월 평균 소득은?

        ——-만원

    분산분석 개요

      분석 과정

      • 가정검토

        • 정규성 검정: 데이터 탑색을 통해 정규분포 이루는가?
        • 등분산성 검정: Levene 통계량 제시
      • 가정설정

        • 귀무가설: 모든 집단의 평균은 동일하다.
        • 대립가설: 적어도 한 집단의 평균은 다르다.
      • 가설검증

        • F값: 분산분석에서 F검증을 통해 제시되는 검정통계량
        • 유의확률: 가설채택/기각의 기준
      • 사후검증

        • 유의한 차이가 날 경우 구분되는 집단군 확인

2. 분산 분석 사례

    연구문제

    • 모 학원에서 학원 수강생을 대상으로 영어강의 만족도를 조사한다. 즉 연령대 10대, 20대, 30대, 40대 이상의 4개의 그룹의 영어강의 만족도의 차이가 있는가?

    연구 가설

    • 귀무가설: 모든 집단의 평균은 동일하다.
    • 대립가설: 적어도 한 집단의 평균은 다르다.

    F 검정 통계량으로 p값을 파악하여 유의수준과 비교

    • P값 < 유의수준 (a)

      ->귀무가설 기각하여 적어도 한 집단의 평균은 다르다

    • P값 > 유의수준 (a)

      ->귀무가설 채택하여 모든 집단의 평균은 동일 하다

    사후 분석

    • 세집단 이상의 평균의 차이가 있다는 것은 모든 집단간에 서로 차이가 있다는 것이 아니라 적어도 두집단간에 차이가 있다는 말이므로 구체적으로 어느 집단 간에 평균 차이가 나는지 분석함

3. 분석 방법

분석 방법

    일원분산 분석

    • 메뉴에서 [분석][평균비교][일원배치분산분석]을 클릭함
    • 일원배치 분산 분석 분석 대화창이 뜨면 요인(F)에는 집단 변수를 종속변수에는 분석하고자 하는 변수를 투입함. 연령은 4개의 수준 (10대, 20대, 30대, 40대 이상)으로 되어 있으며 강의 만족도는 강의에 대한 만족도를 5점 척도로 하여 조사한 것임
    • 사후분석에는 일반적으로 Duncan, Sheffe 등의 방법이 주로 사용됨

4. 이원분산분석

    분산분석의 종류

      일원분산분석

      • 독립변수가 하나인 분산분석
      • EX: 대·중·소 도시별 노동자 평균임금 차이

      이원 분산 분석

      • 독립변수가 두개인 분산분석
      • 두변수의 영향 (주 효과)를 ㅌ홍시에 파악하여 상호작용효과도 알아볼 수 있는 장점
      • 독립변수 간의 ‘교호작용(상호작용)’을 파악하는데 분석 초점을 둠
      • EX: 운동종류와 섭취음식종류에 따른 심폐끼능 강화차이
        • 운동종류: 헬스, 수영, 태권도
        • 섭취음식: 채식, 육식
      • 그래프로 그렸을 때 (교호작성도) 상호작용이 있으면 두 선의 방향이 서로 다르게 교차된다.
      연구문제

      • 성별과 연령에 따라오디오 강의 만족도에 따라 어떠한 차이가 있는가?
      • 귀무가설: 성별과 연령의 교호작용에 따라서 그룹별 만족도가 같다
      • 대립가설: 성별과 연령의 교호작용에 따라서 그룹별 만족도가 다르다
      • 만약 교호작용이 존재한다면 인자A 와 인자B의 효과를 따로 검정하는 것은 의미가 없게 되며 처리의 수가 a*b인 일원분산 분석으로 간주하여 ab개의 처리간 평균의 동일성을 검정하거나 차이를 추정하게 됨
      • 만약 교호작용이 존재하지 않는다면 인자 A 의 효과와 인자 B의 효과에 대해서 별도로 검정함

      이원분산 분석 사례 분석 방법

      • 분산분석(강의만족도) 파일을 염
      • 이원분산을 하기 위해서는 메뉴에서 [분석]->[일반선형모형]->[일 변량]을 클릭함
      • 일 변량 대화창이 나타나면 모수 요인(F)에는 연령과 성별을, 그리고 종속변수에는 ‘라디오강의 만족도’를 투입함
      • 모형 버튼을 클릭하면 아래와 같이 모형 대화상자가 나타남
        • 완전요인모형: 요인의 주 효과와 교호작용효과를 프로그램이 자동으로 분석하는 것
        • 사용자정의: 연구자가 보고자 하는 요인 및 교호작용을 선택하는 것
      • 제곱합
        • 제3유형: 제곱한 계산법을 설정하는 것으로서 일반적으로 결측셀이 없는 모형의 경우 사용
        • 제4유형: 제곱한 계산법을 설정하는 것으로서 일반적으로 결측셀이 있는 모형의 경우 사용
      • 교호작용이 나타나는지 어떠한지를 그림으로 알기 쉽게 파악하고 레포팅에도 사용하기 위해서 도표(T)를 클릭함
      • 그런 후 수평축과 선 구분을 지정하여 ‘추가’를 누르면 아래 도표 칸에 설정이 됨

      분석결과

      • 먼저 연령*성별의 교호작용이 유의한지를 먼저 파악해야 함
      • 여기서 연령*성별 교호작용의 유의 확률 p값은 0.001로서 0.05보다 크기 때문에 학습자의 연령과 성별의 교호작용에 따라서 라디오 강의 만족도에 차이가 남
      • 반면 주 효과인 연령은 p=0.725, 성별은 p=0.905로서 주 효과에 따른 라디오 강의 만족도는 유의한 차이가 존재하지 않음
      • 즉 학습자의 성별과 연령은 라디오 강의 만족도에 영향을 미치지 않음
      • 소스 제 lll 유형 제곱합 자유도 평균제곱   유의확률
        수정모형 15.256a 7 2.179 3.336 .002
        절편 543.232 1 543.232 839.010 .000
        연령 .854 3 .285 .440 .725
        성별 .009 1 .009 .014 .905
        연령*성별 11.843 3 3.948 6.097 .001
        오차 98.415 152 .647    
        합계 1463.625 160      
        수정합계 113.671 159      

        a.R제곱=.134(수정된 R제곱 =.094)

      • 만약 성별*연령의 상호작용 효과가 유의하지 않는다면 두 그래프 선이 만나지 않았을 것임. 그러나 본 연구에서는 성별*연령의 상호작용(교호작용)이 유의하였으므로 서로 만나는 지점이 생기게 됨