Homework 2 - F0 manipulation

F0 조작 과제

  • Haram Lee
  • 2026-03-22
  • studies / 26-1 / korean-phonetics

0. 개요

  • 본 과제에서는 제공된 음성 파일을 이용하여, GK 화자의 첫 세 단어SK 화자와 유사한 운율적 특성을 갖도록 조작하였다.
  • 과제의 핵심은 단순히 단어를 바꾸는 것이 아니라, 동일한 단어가 화자에 따라 어떻게 다르게 실현되는지를 F0(기본주파수), duration, 그리고 전반적인 prosody의 관점에서 관찰하고 조작해 보는 데 있다. 따라서 본 작업에서는 월요일, 금요일, 일요일 세 단어를 대상으로, GK와 SK의 발화를 비교하여 음절 단위로 길이와 pitch를 측정한 뒤, GK 발화가 SK 발화에 더 가깝게 들리도록 수정하였다.

1. 조작 과정

1-1. 구간 분할 및 측정

  • 먼저 원본 파일에서 두 화자의 발화를 분리하고, GK와 SK 각각의 첫 세 단어인 월요일, 금요일, 일요일을 TextGrid로 분할하였다.
  • 이후 각 단어를 다시 음절 단위로 세분화하여 월-요-일, 금-요-일, 일-요-일 구조로 나누었다. 이렇게 나눈 뒤 각 음절의 duration과 화면상에서 확인한 F0 값을 기록하였다.

  • 분석 결과, GK와 SK는 같은 단어를 발화하더라도 음절별 길이와 F0 패턴에서 차이를 보였다. 이를 정리한 표는 다음과 같다.

[표 1] SK 화자 음절별 duration 및 F0

단어음절Duration (s)확인한 F0 값 (Hz)
월요일0.249736192.7
월요일0.206882225.8
월요일0.320799225.7
금요일0.272332204.3
금요일0.235035212.9
금요일0.333444222.4
일요일일(1)0.270243232.0
일요일0.143685289.9
일요일일(2)0.179845223.6

[표 2] GK 화자 음절별 duration 및 F0

단어음절Duration (s)확인한 F0 값 (Hz)
월요일0.323457281.3
월요일0.124329335.6
월요일0.228154179.9
금요일0.204905272.7
금요일0.248632316.4
금요일0.184464179.8
일요일일(1)0.275582257.8
일요일0.190692315.9
일요일일(2)0.266569179.3
  • 이 표를 보면 SK 화자는 월요일, 금요일에서 마지막 음절 을 가장 길게 실현하는 경향이 있었고, 일요일에서는 첫 이 가장 길게 나타났다. 반면 GK 화자는 월요일에서 첫 음절 이 가장 길고 가 매우 짧았으며, 금요일에서는 가 상대적으로 길게 실현되었다. 또한 F0 측면에서는 GK가 대체로 SK보다 초반 또는 중간 음절에서 더 높은 값을 보였고, 마지막 음절은 오히려 더 낮게 실현되는 경우가 많았다.

1-2. 상대 길이 비교 및 duration 조작

  • Duration 조작을 위해 먼저 GK 값을 SK 값에 맞추기 위한 **상대 길이 비율(relative duration)**을 계산하였다. 예를 들어 월요일의 경우 SK와 GK의 duration 차이를 비교하면, GK의 은 줄이고, 은 늘리는 방향으로 조정해야 한다는 점을 확인할 수 있었다.

  • 실제 조작에서는 위에서 계산한 비율을 그대로 적용하기보다는, 더 자연스러운 결과를 위해 soft version을 사용하였다. 예를 들어 월요일에서는 을 1보다 작은 값으로 설정하여 약간 줄이고, 은 1보다 큰 값으로 설정하여 늘리는 방식으로 duration tier를 조정하였다.
  • 이때 Praat Manipulation 객체의 duration tier에서 각 단어의 절대시간 기준 midpoint를 잡아 점을 추가하고, 구간별 상대 길이 값을 입력하는 방식으로 duration을 조작했다.

1-3. F0(pitch) 조작

  • 최종적으로 화자의 말투 차이를 가장 크게 만드는 요소는 F0 contour라고 판단하였다. 따라서 Manipulation 객체의 pitch tier에서 GK와 SK의 contour를 비교하면서, GK의 음절별 pitch 흐름을 SK에 가깝게 수정하였다.
  • 먼저 측정 결과를 보면 GK는 월요일, 금요일, 일요일 전반에서 초반 또는 중간 음절의 pitch가 SK보다 더 높게 실현되는 경향을 보였다. 반면 마지막 음절에서는 SK보다 더 낮거나 급격하게 하강하는 경우가 있었다. 이에 따라 전체 조작 방향은 다음과 같았다.
  1. 초반/중간 음절의 과도한 peak를 낮춤
  2. 마지막 음절의 지나친 하강을 완화
  3. 단어 경계 부근에서 비정상적으로 튀는 spike를 제거하거나 낮춤
  4. SK처럼 끝부분에서 필요한 상승 또는 완만한 연결을 만듦
  • 예를 들어 월요일에서는 GK의 가 SK보다 훨씬 높게 나타났기 때문에 이 두 음절의 peak를 낮추고, 마지막 은 지나치게 낮아지지 않도록 약간 올려 주었다. 금요일에서도 GK의 , 가 지나치게 높아 이를 낮추고, 마지막 은 SK처럼 너무 바닥까지 떨어지지 않게 보정하였다. 일요일은 첫 의 pitch가 GK에서 더 높았기 때문에 이를 조금 낮추고, 마지막 은 SK처럼 더 자연스럽게 종결되도록 조정하였다.
  • Pitch 조작은 정확한 Hz 수치 하나만을 맞추기보다, contour의 전체 모양을 SK와 유사하게 만드는 데 초점을 두었다. 따라서 음절 중심 시점의 목표 F0 값을 참고하되, 실제 조작에서는 그 사이 연결이 지나치게 꺾이지 않도록 중간 점을 일부 추가하거나 불필요한 점을 삭제하였다. 특히 Praat의 자동 pitch tracking에서 나타난 비정상적인 spike는 실제 음성학적 특성이라기보다 추적 오류로 판단하고 조정 대상에서 제외하였다.

1-4. 조작 과정에서 확인한 점

  • 이번 조작을 진행하면서 확인한 가장 중요한 점은, 두 화자의 차이가 단순히 “다른 단어를 말해서” 생기는 것이 아니라는 점이다. 실제로 월요일, 금요일, 일요일은 동일한 어휘지만, 화자에 따라 음절 길이 구조, pitch peak의 위치, 문말 하강 양상이 다르게 나타났다. 따라서 수업 중 예시처럼 “단어에서 걸렸다”라고 표현하는 것은 음성학적으로 충분히 정밀한 설명이 아니다. 보다 정확하게는, 같은 단어라도 그것이 실현되는 운율적 패턴이 다르기 때문에 청자가 차이를 인식하게 된다고 보는 것이 타당하다.
  • 또한 실제 작업 과정에서는 월요일이 완전히 중립적인 월요일이라기보다는 다소 월료일처럼 들리는 구간이 있었다. 이는 F0나 duration과 같은 prosodic manipulation만으로는 완전히 해결하기 어려운 부분이었다. 즉, 이번 과제에서 다룬 것은 주로 어조에 따른 특성이며, 분절음(segmental quality) 자체를 완전히 바꾸는 작업은 아니기 때문이다. 따라서 결과 음성은 SK의 억양과 길이를 어느 정도 반영하게 되었지만, 동시에 GK 화자의 일부 분절음적 특성은 여전히 남아 있었다.

2. 결론

  • 이번 과제를 통해 같은 단어라도 화자에 따라 매우 다른 방식으로 실현될 수 있으며, 그 차이는 단순한 어휘 차이보다는 억양의 차이로 더 잘 설명될 수 있음을 확인하였다. 특히 월요일, 금요일, 일요일의 경우 음절별 duration과 F0를 세분화하여 비교해 보니, 화자 간 차이는 음절의 상대적 길이, pitch peak의 위치, 문말 처리 방식에서 체계적으로 나타났다. 이를 바탕으로 GK 발화를 SK 쪽으로 조작해 보면서, 말투나 억양의 인상이 실제로 얼마나 크게 바뀔 수 있는지도 직접 확인할 수 있었다.
  • 해당 유튜버의 “단어에서 걸렸다”는 표현은 기술적으로는 부정확하다. 월요일, 화요일, 금요일은 두 한국어 변이 사이에서 어휘적으로 대립하는 항목이 아니며, 차이가 드러나는 지점도 어휘 선택 자체가 아니다. 오히려 문제의 핵심은 동일한 단어가 각 변이에서 서로 다른 prosodic realization을 가진다는 데 있다. 즉 청자가 인지하는 차이는 특정 단어의 사용 여부가 아니라, 해당 단어가 발화될 때 나타나는 음절별 pitch contour, F0 peak alignment, relative duration, phrase-final lowering와 같은 운율적 특성의 차이에서 비롯된다. 따라서 유튜버가 이를 더 정밀하게 설명한다면, “제가 다른 단어를 써서 티가 난 게 아니라, 같은 요일 이름을 말해도 높낮이와 억양 패턴이 제 지역 방언식으로 실현돼서 들켰다”라고 표현하는 것이 더 적절할 것이다.
  • 한편, 작업 과정에서 가장 어려웠던 점은 prosody와 segment의 경계를 체감하는 부분이었다. 예를 들어 GK의 월요일이 다소 월료일처럼 들리는 인상은 pitch를 아무리 조정해도 완전히 없어지지 않았는데, 이를 통해 운율 조작만으로는 분절음적 특성까지 완전히 바꾸기 어렵다는 점을 알 수 있었다. 즉, F0와 duration은 화자의 방언적·개인적 말투를 상당 부분 바꿀 수 있지만, 완전한 변환을 위해서는 자음과 모음의 질, 연결 방식 등 segmental aspect까지 함께 고려해야 한다.
Discussion