반응형

고급 조사방법론 (Advanced Survey Research Methods)

주제: 표본 설계의 논리와 전략 (Logic and Strategy of Sampling Design)


[Part 1] 표집의 논리: 왜 전수조사가 아닌가?

목표: 모집단(Population)과 표본(Sample)의 관계, 그리고 추론의 위험성을 이해한다.

1. 표집의 역사와 교훈

  • 1936년 리터러리 다이제스트(Literary Digest) 사건:
    • 1,000만 장의 모의 투표용지를 배포하고 240만 명의 응답을 받음 (초대형 표본).
    • 결과: 랜던(Landon) 당선 예측 실패 (루즈벨트 압승).
    • 원인: 표집틀(Sampling Frame)이 전화번호부와 자동차 등록부였다. 당시 대공황기에 전화와 차가 있는 '부유층(공화당 지지)'만 표집된 체계적 편향(Systematic Bias) 발생.
    • 교훈: "표본의 크기(Size)보다 표본의 질(Quality/Representativeness)이 훨씬 중요하다."

2. 핵심 용어의 정립

  • 모수(Parameter): 모집단의 실제 값 (μ, σ). 우리는 이것을 영원히 알 수 없다 (신(God)만이 안다).
  • 통계치(Statistic): 표본에서 얻은 값 (x̄, s). 우리는 이것으로 모수를 추정한다.
  • 표집틀(Sampling Frame): 실제로 표본이 추출되는 명부 (예: 전화번호부, 학적부). 모집단과 100% 일치하지 않을 때 **'커버리지 오차(Coverage Error)'**가 발생한다.

[Part 2] 확률 표집 (Probability Sampling): 과학적 추론의 표준

목표: 모든 사례가 뽑힐 확률이 동일하거나 알려져 있는(EPSEM) 표집법을 익힌다.

1. 단순 무작위 표집 (Simple Random Sampling: SRS)

  • 원리: 모든 조합이 뽑힐 확률이 동일함 (난수표 사용).
  • 장점: 가장 이상적인 통계적 모형.
  • 단점: 모집단 전체의 명부가 없으면 불가능. 물리적으로 시행하기 어려움.

2. 체계적 표집 (Systematic Sampling)

  • 원리: 명부에서 매 k번째 요소를 추출 (예: 100명 중 10명을 뽑는다면, 매 10번째 사람).
  • 주의점: 명부에 **주기성(Periodicity)**이 있으면 치명적 편향 발생.
    • 예: 아파트 호수 명부에서 매 10번째를 뽑았더니, 전부 '라인 끝집(넓은 평수)'만 걸리는 경우.

3. 층화 표집 (Stratified Sampling) ★정밀도 향상

  • 원리: 모집단을 동질적인 하위 그룹(Strata)으로 나누고, 각 층에서 무작위 추출.
  • 논리: "층 내부는 동질적(Homogeneous), 층 간은 이질적(Heterogeneous)"
  • 유형:
    • 비례 층화: 모집단 성비가 6:4면 표본도 6:4로 뽑음. (대표성 확보)
    • 비비례 층화: 소수 집단(예: 다문화 가정)을 분석하기 위해 의도적으로 가중치를 두어 많이 뽑음.

4. 군집(집락) 표집 (Cluster Sampling) ★경제성 확보

  • 원리: 모집단을 자연적인 덩어리(Cluster)로 나누고, 덩어리 자체를 뽑음. (예: 서울시 반)
  • 논리: "군집 내부는 이질적(Heterogeneous), 군집 간은 동질적(Homogeneous)"
  • 특징: 비용은 절감되지만, 단순 무작위 표집보다 표집 오차(Sampling Error)가 커진다. (설계 효과 Design Effect 고려 필요)

[Part 3] 비확률 표집 (Non-probability Sampling): 현실적 대안

목표: 무작위 추출이 불가능하거나 탐색적 연구일 때 사용하는 방법을 익힌다.

  1. 편의 표집 (Convenience Sampling): 길거리 설문 등. 일반화 불가능.
  2. 유의(판단) 표집 (Purposive/Judgmental Sampling): 연구자의 전문적 지식으로 "가장 적합한 대상"을 선정. (예: 델파이 조사)
  3. 눈덩이 표집 (Snowball Sampling): 모집단을 찾기 힘들 때(예: 마약 사범, 불법 체류자) 한 명을 통해 지인을 소개받음.
  4. 할당 표집 (Quota Sampling): 성별/연령별 비율을 맞추지만, 무작위가 아님(길거리에서 20대 여자만 골라 잡음). 층화 표집과 헷갈리지 말 것.

[Part 4] 표본 크기(Sample Size)의 결정

목표: "몇 명이나 뽑아야 합니까?"라는 질문에 통계적으로 답한다.

1. 표본 크기를 결정하는 요소

  • 신뢰 수준 (Confidence Level): 보통 95% (1.96σ) 또는 99%.
  • 신뢰 구간 (Confidence Interval): 오차 한계 (예: ±3%p).
  • 모집단의 이질성 (Heterogeneity): 모집단이 다양할수록 더 큰 표본이 필요하다. (모두가 똑같은 복제인간이라면 1명만 뽑으면 됨).

2. 중심극한정리 (Central Limit Theorem)

  • 표본의 크기(n)가 충분히 크다면(보통 n ≥ 30), 모집단의 분포와 상관없이 표본 평균의 분포는 정규분포를 따른다. 이것이 통계적 추정을 가능하게 하는 핵심 원리다.

3. 검증력 분석 (Power Analysis) - G*Power

  • 대학원 수준 연구에서는 단순히 "300명이면 된다"가 아니라, **효과 크기(Effect Size)**와 **검증력(Power, 1-β)**을 고려하여 필요한 N수를 산출해야 한다.

[Part 5] 오차의 종류와 통제 (Total Survey Error)

목표: 표집 오차보다 더 무서운 비표집 오차를 경계한다.

  1. 표집 오차 (Sampling Error): 전수조사를 하지 않아서 생기는 태생적 오차. N을 늘리면 줄어든다.
  2. 비표집 오차 (Non-sampling Error): N을 늘려도 줄어들지 않음.
    • 불포함 오차 (Non-coverage Error): 표집틀이 불완전함.
    • 무응답 오차 (Non-response Error): 응답 거부자가 특정 성향을 가질 때 데이터는 왜곡됨. (예: 소득 조사를 거부하는 고소득층)
    • 측정 오차 (Measurement Error): 설문지 문항이 잘못됨.

[심화 토론 주제]

  1. "표본이 클수록 좋다"는 명제는 항상 참인가? (빅데이터 시대에 데이터의 질과 양의 문제, Selection Bias)
  2. **온라인 패널 조사(Online Panel Survey)**는 확률 표집인가 비확률 표집인가? 이를 통해 얻은 데이터의 일반화 가능성을 논하시오.
  3. 질적 연구(Qualitative Research)에서의 표집(Sampling)은 양적 연구와 어떤 다른 논리(Theoretical Sampling)를 가지는가?

[추천 참고 문헌]

  • Leslie Kish, Survey Sampling. (표집 이론의 고전)
  • Lohr, S. L., Sampling: Design and Analysis. (수리적 배경과 실무적 적용)
  • Dillman, D. A., Internet, Phone, Mail, and Mixed-Mode Surveys. (조사 실무와 오차 통제)
반응형

+ Recent posts