이미 살펴본 바와 같이 파동은 단순하거나 복잡할 수 있습니다. 단순 파동은 단순한 진동을 나타내는 수학적 sine 함수로 설명할 수 있습니다. 복잡한 파동은 적어도 두 개의 사인파가 합쳐진 것으로 구성됩니다. 파동은 기본 주파수를 공유하면서 복잡도가 다를 수 있습니다.
이 동영상에서는 음성의 파형 표현에 대해 살펴볼 것입니다. 먼저 파동이 무엇인지 생각해 봅시다. 파동은 매질을 통해 이동하는 방해(disturbance)입니다. 이 매질은 군중 속의 사람부터 공기 중의 분자, 심지어 현악기의 박자에 이르기까지 무엇이든 될 수 있습니다. 파형은 이러한 방해를 표현한 것입니다. 예를 들어 천장에 용수철로 매달린 추가 있..
Module 1 – Phonetics and Representations of Speech > Introduction to the International Phonetic Alphabet

1. 전체 IPA 차트 a. 국제 음성 알파벳은 표준 음성 기호 세트를 사용하여 모든 언어를 전사할 수 있도록 설계된 도구입니다. b. 차트는 4가지 주요 섹션으로 나눌 수 있습니다: i. 자음, ii. 모음, iii. 분음 부..
Module 1 – Phonetics and Representations of Speech > Vowel articulation and description

모음은 성대가 열려 있는 상태에서 만들어지는 말소리로, 조음기관이(입술, 치아, 혀) 입에서 나오는 공기의 흐름을 어떤 식으로든 방해하지 않는다는 의미입니다. 이 동영상에서는 IPA 차트에서 기호로 표시되는 모음 특성에 중점을 두고 모음 발성에 대해 설명합니다. 입술과 혀의 위치가 모음..
Module 1 - Phonetics and Representations of Speech > Consonants

자음은 성대가 어느 정도 수축하면서 만들어지는 말소리입니다. 음성학자들은 자음을 세 가지 조음 차원에 따라 정의합니다: 음성(vpice),장소(palace), 그리고 매너(manner) 이 비디오에서는 이러한 각 용어를 소개하고 각 차원에 따라 달라지는 소리의 몇 가지 예를 제공합니다. 첫 번째 파라미터인 음성은 IPA 차트에서 이진(binary) 옵션으로 표시됩니다. 이..
Module 1 – Phonetics and Representations of Speech > vocal anatomy

우리는 말을 할 때 입을 사용한다고 생각하지만, 말을 하기 위해서는 횡격막부터 코에 이르는 해부학적 구조를 사용해야 합니다. 말을 하는 데 필요한 해부학적 구조를 모두 합쳐서 성도(vocal tract)라고 합니다. 성도의 중심에는 일반적으로 "성대(voice box)"라고 알려진 후두(la..
Human-annotated labels and explanations are critical for training explainable NLP models. However, unlike human-annotated labels whose quality is easier to calibrate (e.g., with a majority vote, human-crafted free-form explanations) can be quite subjective. Before blindly using them as ground truth to train ML models, a vital question needs to be asked: How do we evaluate a human-annotated expla..
Pragmatics and non-literal language understanding are essential to human communication, and present a long-standing challenge for artificial language models. We perform a fine-grained comparison of language models and humans on seven pragmatic phenomena, using zero-shot prompting on a expert-curated set of English materials. We ask whether models (1) select pragmatic interpretations of speaker u..