Optional HW - Critique on exposure measurement
서울말 '노출' 변수의 측정론적 문제에 대한 비판
- Haram Lee
- 2026-04-09
- studies / 26-1 / korean-phonetics
저자들이 단일 리커트 척도(1–5)로 압축한 “노출"에는 실제로 매우 이질적인 경험들이 혼재한다. 서울 거주 경험, 직장·학교에서의 대면 접촉, 드라마·미디어 시청, 서울말을 의식적으로 모방하려는 태도, 심지어 일부 참여자의 경우 북한 화자와의 접촉까지 포함되어 있다. 이는 측정론적으로 말하면 서로 다른 latent variable를 하나의 observed variable로 단일화한 것이다.
해당 문제를 통계적으로 구체화하면 다음과 같다.
진짜 인과 구조가
처럼 여러 개의 독립적인 노출 경로(X_1 : 대면 접촉, X_2 : 미디어 노출, X_3 : 모방 태도 등)로 이루어져 있는데, 저자들은 이것을
라는 단일 변수 모형으로 추정한 것이다. 이 경우 X_{composite} 는 X_1, X_2, X_3 의 가중합이 아니라 연구자의 주관적 판단으로 부여된 리커트 점수이므로, 회귀계수 \hat{\beta} 의 해석이 불분명해진다. 계수가 무엇의 효과를 나타내는지 특정할 수 없는 것이다.
더 심각한 것은 누락변수가 편향되었다는 것이다. 예를 들어 서울 한국어 화자와 자주 접촉하는 화자일수록 교육 수준이 높거나, 한국과의 경제적 연결이 강하거나, 언어 위신에 더 민감할 가능성이 있다. 이런 변수들이 Pillai 점수에도 독립적으로 영향을 준다면, OLS 추정량은
의 형태로 편향되며, 노출의 “진짜” 효과를 과대 또는 과소 추정하게 된다.
또한 리커트 척도 자체의 측정 오차 문제도 있다. 응답자마다 ‘자주’나 ‘가끔’의 기준이 다르고, 자기보고(self-report) 방식은 측정 오차(measurement error)가 비무작위적(non-classical) 일 가능성이 높다. 예를 들어 서울말에 긍정적인 태도를 가진 화자는 노출 빈도를 실제보다 높게 보고하는 경향이 있을 수 있고, 이런 체계적 오차는 단순한 감쇠 편향(attenuation bias)이 아니라 추정 방향 자체를 왜곡할 수 있다.
결국 이 논문의 선형 회귀 결과
는 “서울 한국어 노출이 Pillai 점수를 낮춘다"는 인과 명제를 지지하는 것이 아니라, 측정 오차와 누락변수가 뒤섞인 복합적 생활 양식 변수와 Pillai 점수 사이의 상관관계를 보여 주는 것으로 읽어야 한다. 인과적 해석을 하려면 최소한 도구변수(instrumental variable) 설계나 노출 경로를 분리한 다변량 측정 모형, 혹은 잠재변수 모형(SEM 등)이 필요했을 것이다.