음성

Module 2 - Acoustic characteristics of vowels

김아다만티움 2023. 8. 16. 21:46

 Courses Speech Processing Module 2 – Acoustics of Consonants and Vowels Videos Acoustic characteristics of vowels

https://speech.zone/courses/speech-processing/module-2-acoustics-of-consonants-and-vowels/videos-2/acoustic-characteristics-of-vowels/

 

Acoustic characteristics of vowels

 

speech.zone

이 비디오에서는 모음의 파형, 스펙트럼 및 스펙트로그램을 고려할 것입니다.
스펙트럼을 통해 complex wave의 성분 주파수와 진폭이 드러나고, harmonics는 개별 peak로, 포먼트는 증폭 및 감쇠된 주파수의 범위로 표시되는 것을 보았습니다. 이러한 스펙트럼 차이는 우리가 들을 수 있는 다양한 특성을 만들어냅니다.

모음의 경우 더 나아가 스펙트럼과 스펙트로그램에서 배울 수 있는 것이 아직 더 많습니다.
성대(vocal tract)의 첫 번째와 두 번째 포먼트는 모음의 높이와 advancement에 대한 인식 간 상관관계가 있으며, 특정 모음은 특징적인 스펙트럼 모양을 가지고 있습니다.
여기에서는 첫 번째와 두 번째 포먼트가 강조 표시된 모음 [a] [i] [u]의 스펙트럼을 볼 수 있습니다.

[a]에서 F1과 F2는 서로 매우 가깝지만 [i]에서는 다소 멀리 떨어져 있습니다. [u]에서 F1과 F2는 다시 서로 가깝지만 주파수 범위는 [a]에서 본 것보다 낮습니다.

다음 슬라이드는 미국 영어 모음의 모음 포먼트 패턴을 설명하면서 그 과정에서 몇 가지 일반화를 지적합니다. 이러한 패턴은 우연이 아닙니다. 스펙트럼에서 포먼트 위치는 모음을 발음할 때 입술과 혀의 위치에 따른 결과입니다.

첫 번째와 두 번째 포먼트의 상대적 위치에 따라 우리가 듣는 모음의 특성이 달라집니다.
먼저 포먼트와 모음의 높이 차원 간 관계를 살펴보겠습니다. 아래는 8개 미국 영어 모음의 스펙트로그램입니다. [i, ɪ, ɛ, æ, ɑ, ɔ, ʊ, u]

모음은 높이, advancement 및 rounding에 따라 IPA 기호를 사용하여 설명할 수 있다는 점을 기억하세요. 예를 들어, [u] 모음은 뒤쪽이 높고 둥글게 됩니다. 처음 두 개의 포먼트가 모음의 높이 및 advancement와 관련이 있음을 곧 알게 될 것이며 이 관계를 설명할 것입니다.
이러한 모음의 포먼트는 스펙트로그램의 다양한 주파수 범위에서 어두운 수평 대역(dark horizontal bands)으로 표시됩니다.
처음 세 개의 포먼트는 각 스펙트로그램의 왼쪽에 화살표로 표시되어 있습니다.
먼저 고모음(high vowels)을 고려했을 때 첫 번째 포먼트가 이 네 모음 각각에 대해 상당히 낮은 주파수에 있음을 알 수 있습니다. (고모음의 F2 주파수는 그다지 유사성이 없는 것 같습니다). 실제로 모음이 낮을수록 스펙트로그램에서 첫 번째 포먼트가 더 높은 것으로 나타났습니다.
모음 높이와 첫 번째 포먼트의 위치 사이의 이러한 관계는 낮은 모음을 비교하면 더욱 명확해집니다. [ɛ, æ, ɑ, ɔ]는 모두 열린 모음(open) 또는 열린 중간 모음(open-mid)입니다. 이 네 개의 열린 모음에서 F1은 서로 다소 비슷하지만, 고모음을 비교하면 F1이 저모음에서 더 높고 고모음에서 더 낮다는 것을 알 수 있습니다.
따라서 첫 번째 포먼트는 모음 높이와 반비례합니다. close/고모음은 F1이 낮고, oepn/저모음은 F1이 높습니다.

이제 advancement, 즉 모음이 얼마나 앞 또는 뒤에 있는지 살펴봅시다.
모음의 맨 위 줄은 모두 음성 속성 FRONT를 공유하며, 맨 아래 줄은 모두 BACK 속성을 공유합니다.
첫 번째 포먼트가 모음 높이와 관련이 있다는 것을 이미 살펴보았습니다.이제 두 번째 포먼트에 대해 살펴봅시다.
앞모음(front vowels)에 걸쳐 두 번째 포먼트를 비교하면 주파수가 모두 서로 상당히 유사하다는 것을 알 수 있습니다. 이에 비해 뒷모음(back vowels)은 전체적으로 앞모음(front vowels)보다 F2 값이 낮습니다.
따라서 두 번째 포먼트는 vowel frontness과 직접적으로 관련이 있습니다. 모음이 앞쪽에 많을수록 F2가 높아집니다. 모음이 뒤쪽에 있을수록 F2는 낮아집니다.

모음 높이와 관련하여 첫 번째와 두 번째 포먼트 사이의 관계도 고려할 수 있습니다. 앞모음(front vowels)의 F1과 F2를 보면 일반적으로 첫 번째와 두 번째 포먼트 사이에 진폭이 낮은 주파수 범위가 약간 있음을 알 수 있습니다. 이에 비해 뒷모음(back vowels)은 첫 번째와 두 번째 포먼트가 서로 매우 가깝습니다.

이 그림은 앞의 스펙트로그램에서 포먼트 값을 쉽게 비교할 수 있도록 도식화하여 요약한 것입니다. 이 형태에서는 close vowels이 oepn vowels보다 F1이 낮다는 것을 알 수 있습니다. 또한 왼쪽의 앞모음(front vowel)이 오른쪽의 뒷모음(back vowel)보다 F2가 더 높다는 것을 알 수 있습니다.
또한 흥미로운 점은 뒷모음은 모두 비슷한 F2 값을 가지고 있어 거의 동일하게 뒤쪽에 있는 반면, 앞모음은 더 열린 모음일수록 F2가 감소한다는 것입니다.
이는 이러한 열린 모음(open vowels)을 생성하는 동안 턱의 위치 때문에 닫힌 모음보다 약간 더 뒤로 생성되기 때문입니다.
음성학자들은 위에서 설명한 모음 포먼트 패턴을 사용하여 첫 번째와 두 번째 포먼트를 서로 비교하여 모음 간의 음향적(acoustic) 관계를 시각화합니다.
이러한 종류의 도표를 모음 공간(vowel space)이라고 합니다. 여기에는 지금까지 살펴본 8개 모음의 도표가 나와 있습니다.
이 도표는 수학적으로 다소 특이한 배열로 F1을 y축에, F2를 x축에 배치한 것인데, 그 결과 IPA 모음 차트와 매우 흡사한 그림이 만들어집니다.
이 보기는 첫 번째 포먼트와 모음 높이, 두 번째 포먼트와 모음 advancement 사이의 관계를 강조합니다.

 

 

IN this video we will consider the waveforms, spectra and spectrograms of vowels.
We have seen that the component frequencies and amplitudes of complex waves are revealed by the spectrum, with harmonics shown as individual peaks, and formants as ranges of amplified and dampened frequencies. These spectral differences result in different qualities that we can hear.
In the case of vowels, there is still more that we can learn from the spectrum and by extension from the spectrogram.
The first and second formants of the vocal tract correlate with perceptions of vowel height and advancement, with particular vowels having characteristic spectral shapes.
Here we see spectra of the vowels [a] [i] and [u] with the first and second formants highlighted.
In [a] F1 and F2 are quite close together, while in [i] they are rather far apart. In [u] F1 and F2 are again close together, but lower in the frequency range than we saw for [a]
The following slides will illustrate the vowel formant patterns in American English vowels, pointing out some generalizations along the way.
These patterns are not just happenstance. The formant positions in the spectrum are the result of the positions of the lips and tongue during vowel articulation.
The relative position of the first and second formants result in the different vowel qualities that we hear.
First, we will look at the relationship between formants and vowel dimension of height. Here we see spectrograms of 8 american English vowels. [i, ɪ, ɛ, æ, ɑ, ɔ, ʊ, u]
Remember that we can describe these vowels using their IPA symbols according to height, advancement and rounding. For example, the [u] vowel is high back and rounded. We will soon see that the first two formants are related to the Height and Advancement of the vowels and we will describe this relationship.
The formants of these vowels are visible as dark horizontal bands at various frequency ranges in the spectrogram.
The first three formants are indicated by arrows on the left hand side of each spectrogram.
If we consider first the high vowels and look at the first formant, we can see that the first first formant is at quite a low frequency for each of these four vowels. (There does not seem to be much similarity across the F2 frequencies of high vowels.) In fact it turns out that the lower the vowel, the higher the first formant will be in the spectrogram.
This relationship between vowel height and the location of the first formant becomes more clear when we compare the lower vowels.
[ɛ, æ, ɑ, ɔ] are all either open or open-mid. Across these four open vowels, the F1 is again rather similar, but if we compare the high vowels, we see that F1 is higher in the low vowels and lower in the high vowels.
The first formant is therefore inversely related to vowel height. Close/high vowels have lower F1, while open/low vowels have higher F1.
Now let’s look at advancement, or how far front or back a vowel is.
The top row of vowels all share the phonetic property FRONT, while the bottom row all share the property BACK.
We have already seen that the first formant is related to vowel height. Now let’s consider the second formant.
If we compare the second formant across the front vowels we see that they are all fairly similar to each other in frequency. By comparison, the back vowels have lower F2 values than the front vowels as a whole.
Therefore, the second formant is directly related to vowel frontness. The more front a vowel is, the higher F2 will be. The more back a vowel is, the lower F2.
We can also consider the relationship between the first and second formants in relation to vowel height. If we look at F1 and F2 of the front vowels, we can see that there is typically a bit of the frequency range that is low in amplitude between the first and second formants. By comparison, the back vowels have first and second formants that are very close together.
This figure summarizes the formant values from the preceding spectrograms in a schematic way to allow for ease of comparison. In this form, we can see that the close vowels have lower F1 than the open vowels. We can also see that the front vowels on the left have higher F2 than the back vowels on the right.
It is also interesting to note that the back vowels all have similar F2 values, suggesting they are roughly equally far back, while the front vowels show decreasing F2 for more open vowels.
This is due to the position of the jaw during the production of these more open vowels, causing them to be produced slightly further back than the close vowels.
Phoneticians use the vowel formant patterns described above to visualize the acoustic relationships between vowels by plotting the first and second formants against each other.
This sort of plot is known as the vowel space. Here we see a plot of the 8 vowels that we have been looking at so far.
This plot puts F1 on the y-axis and F2 on the x-axis, in what is mathematically a rather unusual arrangement, but which results in a figure that looks rather strikingly like the IPA vowel chart.
This view highlights the relationship between the first formant and vowel height, and the second formant and vowel advancement.