반응형

사회과학 데이터 분석 및 해석론

(The Logic of Analysis and Interpretation in Social Inquiry)


[Part 1] 분석의 전제: 쓰레기 데이터 걸러내기 (Data Cleaning)

목표: 분석 기법보다 더 중요한 '데이터 전처리'의 엄밀성을 배운다. "Garbage In, Garbage Out (GIGO)" 원칙.

1. 결측치(Missing Data)의 처리 전략

  • 단순히 빠진 데이터를 삭제(Listwise Deletion)하는 것이 능사가 아니다. 결측의 패턴을 봐야 한다.
    • MCAR (Missing Completely At Random): 완전 무작위 결측. 삭제해도 무방.
    • MAR (Missing At Random): 다른 변수와 관련이 있는 결측. (예: 여성일수록 몸무게 응답을 안 함 성별로 보정 가능).
    • MNAR (Missing Not At Random): 결측 자체가 정보인 경우. (예: 소득이 아주 높거나 낮은 사람이 응답 거부 삭제 시 편향 발생).
    • 대안: 평균 대체법(Mean Imputation)보다는 **다중 대체법(Multiple Imputation)**이 현대적 표준이다.

2. 이상치(Outlier)와 정규성 검토

  • 이상치: 단순 오타인가, 아니면 의미 있는 극단값인가? (예: 연봉 100억)
    • 연구자의 판단 하에 윈저라이징(Winsorizing)하거나 별도 분석 수행.
  • 통계적 가정: 회귀분석 등을 위한 정규성, 등분산성, 선형성 전제 조건 확인.

[Part 2] 양적 자료의 분석: 통계적 추론의 함정 탈출

목표: p-value의 노예가 되지 않고, 실질적인 의미(Substantive Significance)를 찾는다.

1. 기술 통계와 추론 통계

  • 기술(Descriptive): 데이터의 생김새(평균, 표준편차, 왜도, 첨도)를 설명.
  • 추론(Inferential): 표본을 통해 모집단의 모수를 추정하고 가설을 검증.

2. 변수 관계의 해부 (Elaboration Model) - Lazarsfeld

단순히 "X와 Y가 관계있다"는 것만으로는 부족하다. 제3의 변수(Z)를 투입하여 관계의 본질을 파헤쳐야 한다.

  • 허위 관계 (Spuriousness): Z를 통제했더니 X → Y 관계가 사라짐. (가짜 관계)
  • 매개 관계 (Mediation): X → Z → Y의 경로 확인. (Why & How 설명)
  • 조절 관계 (Moderation): Z의 수준에 따라 X → Y의 강도가 달라짐. (Condition 설명)
  • 억제 관계 (Suppression): Z를 통제했더니 안 보이던 X → Y 관계가 나타남.

3. 통계적 유의성(Statistical Significance) vs. 효과 크기(Effect Size)

  • N수가 커지면 별로 중요하지 않은 차이도 p < .05가 나온다.
  • p-value는 "우연이 아닐 확률"일 뿐, "효과가 크다"는 뜻이 아니다.
  • 반드시 **효과 크기 (Cohen's d, R², η²)**를 함께 보고해야 한다.

[Part 3] 질적 자료의 분석: 코딩과 범주화

목표: 텍스트에서 패턴을 발견하고 이론을 구성하는 귀납적 논리를 익힌다.

1. 질적 분석의 핵심: 코딩(Coding)

  • 개방 코딩 (Open Coding): 데이터를 줄 단위로 읽으며 개념(Concept)을 명명. (분해)
  • 축 코딩 (Axial Coding): 개념들을 하위 범주와 상위 범주로 연결. (재조립)
  • 선택 코딩 (Selective Coding): 핵심 범주(Core Category)를 중심으로 전체 스토리를 통합. (이론화)

2. 해석의 타당성 확보 (Trustworthiness) - Lincoln & Guba

  • 양적 연구의 타당도/신뢰도에 대응하는 개념.
    • 신빙성 (Credibility): 연구 참여자가 연구 결과에 동의하는가? (Member Checking)
    • 전이가능성 (Transferability): 독자가 자신의 상황에 적용할 수 있는가? (Thick Description)
    • 의존성 (Dependability): 연구 과정이 일관적인가? (Audit Trail)
    • 확증성 (Confirmability): 연구자의 편견이 배제되었는가? (Triangulation)

[Part 4] 자료의 해석(Interpretation): 데이터에 입히는 스토리

목표: "분석 결과표"를 "지식"으로 변환하는 논문 작성(Discussion) 능력을 기른다.

1. 결과(Results) vs. 논의(Discussion)

  • 결과: "표 3을 보면 X의 회귀계수가 0.45 (p < .01)로 나타났다." (Fact 나열)
  • 논의: "이 결과는 X가 Y의 주요 예측 요인이라는 기존 A의 이론을 지지한다. 반면, Z변수의 조절 효과가 나타나지 않은 것은 한국 사회의 특수한 맥락 때문으로 해석된다." (Meaning 부여)

2. 해석의 3단계 확장

  1. 내적 해석: 가설이 지지되었는가? 기각되었다면 그 기술적/논리적 이유는 무엇인가?
  2. 외적 해석 (Contextualization): 선행 연구들과 비교했을 때 일치하는가, 충돌하는가? 충돌한다면 왜인가?
  3. 이론적/실천적 함의: 그래서 이 결과가 학계에 어떤 기여를 하는가? 정책적으로 무엇을 시사하는가?

3. 연구의 한계(Limitations) 기술법

  • 비굴하게 사과하는 것이 아니라, **'연구의 범위(Scope)'**를 명확히 하는 것이다.
  • "표본이 작다"에서 끝내지 말고, "따라서 이 결과를 전국 단위로 일반화하는 데는 주의가 필요하며, 후속 연구에서는 층화 표집이 권장된다"와 같이 미래 연구 방향으로 연결해야 한다.

[Part 5] 연구 윤리와 데이터의 정치학

목표: 데이터를 입맛대로 해석하는 유혹을 경계한다.

  1. p-Hacking (피해킹): 유의미한 결과(p < .05)가 나올 때까지 변수를 넣었다 뺐다 하며 분석 모델을 조작하는 행위 금지.
  2. HARKing (Hypothesizing After Results are Known): 결과를 보고 나서 원래 그런 가설을 세웠던 것처럼 사후에 가설을 수정하는 행위 금지.
  3. 체리 피킹 (Cherry Picking): 내 주장에 유리한 데이터만 골라서 보고하는 행위 금지.

[실습 과제]

  1. 양적 연구: 제공된 SPSS/R 출력 결과(Output)를 보고, 단순한 수치 읽기를 넘어 '사회과학적 함의'를 한 문단으로 작성하시오.
  2. 질적 연구: 제공된 인터뷰 녹취록 2페이지를 읽고, '개방 코딩'을 수행하여 핵심 개념 3가지를 도출하시오.

[추천 참고 문헌]

  • Hair, J. F., et al., Multivariate Data Analysis. (다변량 분석의 바이블)
  • Strauss, A., & Corbin, J., Basics of Qualitative Research. (근거이론의 정석)
  • American Psychological Association (APA), Reporting Statistics in Psychology. (통계 결과 보고 방식 표준)
반응형
반응형

연구를 시작하기 전, 우리는 무엇을 준비해야 하는가?


[제1강] 우리는 무엇을 '안다'고 말하는가? (인식론적 기초)

핵심 질문: 나의 주장이 '과학적 지식'이 되기 위한 조건은 무엇인가?

  1. 지식의 원천과 과학의 필요성
    • 일상적 지식의 함정: 전통(Tradition), 권위(Authority), 직관(Intuition)에 의존할 때 발생하는 오류들.
    • 과학적 탐구의 두 기둥: 논리(Logic - 합리성)와 관찰(Observation - 경험성).
    • 사회과학의 특수성: 연구 대상(인간)이 연구자에게 반응함(재귀성), 가치 개입의 문제, 확률적 결정론.
  2. 연구의 패러다임 (Paradigms)
    • 연구자가 세상을 바라보는 '렌즈'를 결정하는 것.
    • 실증주의 (Positivism): 객관적 진리는 존재하며, 발견 가능하다. (자연과학적 방법론)
    • 해석주의 (Interpretivism): 진리는 사회적으로 구성되며, 행위자의 '의미'를 이해하는 것이 중요하다.
    • 비판이론 (Critical Theory): 연구는 숨겨진 권력 구조를 파헤치고 사회를 변화시켜야 한다.

토론: 당신의 연구 주제는 '발견(Discovery)'되는 것인가, 아니면 '해석(Interpretation)'되는 것인가?


[제2강] 이론과 논리: 생각의 지도 그리기

핵심 질문: 이론은 어떻게 만들어지며, 연구에 어떻게 적용되는가?

  1. 과학의 수레바퀴 (The Wheel of Science)
    • 이론 →  가설 → 관찰 →  경험적 일반화의 순환 구조.
  2. 추론의 방식
    • 연역법 (Deduction): 이론에서 시작하여 가설을 세우고 검증함. ("모든 사람은 죽는다 →  소크라테스는 사람이다 →  고로 죽는다")
    • 귀납법 (Induction): 관찰된 데이터에서 패턴을 찾아 이론을 만듦. ("소크라테스도 죽고, 공자도 죽더라 →  고로 모든 사람은 죽는다")
    • 가추법 (Abduction): 최선의 설명을 찾아가는 추론 (현상을 가장 잘 설명하는 가설 선택).
  3. 좋은 이론의 조건
    • 간결성 (Parsimony), 반증 가능성 (Falsifiability), 설명력 (Explanatory Power).

[제3강] 인과성(Causality)의 조건: 상관관계는 인과관계가 아니다

핵심 질문: X가 Y의 원인이라고 확신할 수 있는가?

  1. 인과관계 추론의 3원칙 (J.S. Mill & Lazarsfeld)
    • ① 공변성 (Covariation): 원인과 결과는 함께 변해야 한다. (상관관계 존재)
    • ② 시간적 선후관계 (Time Order): 원인이 결과보다 시간적으로 앞서야 한다.
    • ③ 비허위성 (Non-spuriousness): 제3의 변수(Z)에 의한 결과가 아니어야 한다. (통제변수의 중요성)
  2. 필요조건과 충분조건
    • 사회현상은 대부분 '확률적 원인'이며, 단 하나의 충분조건은 존재하기 어렵다.
  3. 생태학적 오류와 개인주의적 오류
    • 분석 단위(Unit of Analysis)를 혼동할 때 생기는 치명적 논리 오류.

[제4강] 측정(Measurement): 추상을 현실로 가져오기

핵심 질문: '행복', '권력', '소외' 같은 추상적 개념을 어떻게 잴 것인가?

  1. 개념화와 조작화 (Conceptualization & Operationalization)
    • 개념화: 모호한 용어의 의미를 명확히 정의함.
    • 조작화: 측정 가능한 지표(Indicator)로 변환함. (예: 학업성취도  시험 점수)
  2. 신뢰도(Reliability)와 타당도(Validity)
    • 신뢰도: 반복 측정 시 일관된 결과가 나오는가? (저울의 눈금은 일정한가?)
    • 타당도: 측정하고자 하는 것을 정확히 측정했는가? (체중계로 키를 재고 있지는 않은가?)
  3. 측정의 수준
    • 명목, 서열, 등간, 비율 척도의 차이와 통계적 함의.

[제5강] 연구 윤리와 연구자의 책임

핵심 질문: 지식의 추구가 피험자의 권리보다 우선할 수 있는가?

  1. 연구 윤리의 역사적 배경
    • 뉘른베르크 강령, 터스키기 매독 실험 등 비윤리적 연구 사례와 교훈.
  2. 사회과학 연구의 4대 윤리 원칙
    • 자발적 참여와 고지된 동의 (Informed Consent): 연구 목적과 위험을 알고 스스로 참여해야 함.
    • 익명성과 비밀 보장 (Anonymity & Confidentiality): 데이터 관리의 핵심.
    • 기만(Deception) 금지: 불가피한 경우 사후 설명(Debriefing) 필수.
    • 해악 금지 (Do No Harm): 신체적, 심리적, 사회적 피해 방지.
  3. IRB (생명윤리위원회) 심의
    • 연구 설계 단계에서 필수적으로 거쳐야 할 윤리적 검증 절차.

[대학원생을 위한 추천 필독서]

  1. Earl Babbie, The Practice of Social Research. (사회조사방법론의 정석)
  2. Thomas Kuhn, The Structure of Scientific Revolutions. (과학혁명의 구조 - 패러다임의 이해)
  3. Max Weber, "Objectivity" in Social Science. (사회과학에서의 객관성)
  4. C. Wright Mills, The Sociological Imagination. (사회학적 상상력 - 개인 문제와 공적 이슈의 연결)
반응형

+ Recent posts