-
Module 3 - Periodic signal음성 2023. 8. 24. 13:39
Speech Processing>Module 3>Digital Speech Signals>Videos>Periodic signal
Periodic signal
speech.zone
말하기에서 가장 중요한 소리의 원천은 성대의 주기적인 진동입니다.
다음은 음성을 생성할 때 발생하는 두 가지 주요 소리에 대한 설명입니다.
이제 일반적인 특성을 설명하기 위해 몇 가지 공학 용어를 소개하겠습니다.
왼쪽에는 voicing이 있습니다.
음성학 용어인 voicing은 성대의 진동을 의미하며, 그 결과 주기적인 신호가 발생합니다.
주기적 신호는 예측 가능합니다.
왼쪽의 그림을 계속 보고 다음에 어떤 일이 일어날지 말해 보세요.
우리는 이러한 유형의 신호를 '결정론적(deterministic)'이라고 부릅니다.
반면에 마찰(frication)은 주기성이 없는 신호로, 예측이 매우 불가능합니다.
따라서 우리는 이를 '비주기적(aperiodic)' 또는 'non-periodic'이라고 말할 수 있습니다.
(같은 의미입니다.)
비주기적 신호는 예측할 수 없습니다.
오른쪽 그림에서 다음에 무슨 일이 일어날지 짐작할 수 없습니다.
그래서 몇 가지 공학 용어를 사용할 수 있습니다.
주기적 신호는 '결정론적'입니다. 다음에 무슨 일이 일어날지 알 수 있습니다.
비주기적 또는 비주기적 신호는 '확률적(probabilistic)'입니다. 다음에 어떤 일이 일어날지 알 수 없고 무작위적입니다.
주기적 신호는 매우 중요하므로 지금부터 자세히 살펴보겠습니다.
모든 주기적 신호에는 반복되는 패턴이 있습니다.
이 특정 신호에서는 그 반복 패턴이 무엇인지 정말 분명합니다.
또한 0.01초마다 또는 1/100초마다 얼마나 자주 반복되는지도 정확히 알 수 있습니다.
이를 나타내기 위해 몇 가지 표기법을 사용할 수 있습니다.
기본 주기를 나타내기 위해 T0라는 용어를 사용합니다.
T0에는 시간 차원(time dimension)과 초 단위(unit of seconds)가 있습니다.
여기서 T0가 무엇인지 알 수 있습니다.
이 신호가 반복되는 데 걸리는 시간입니다.
여기 또 다른 신호가 있습니다.
이것은 사인파라는 매우 특별한 신호입니다.
이 신호의 기본 주기는 0.1초 또는 1/10초입니다.
따라서 이 주기를 10번 반복하면 정확히 1초의 지속 시간을 채우게 됩니다.
신호에 대해 이야기하는 또 다른 방법은 기본 주기가 0.1초라고 말하는 대신 기본 주파수가 10이라고 말할 수 있습니다.
기본 주파수를 나타내기 위해 F0이라는 표기를 사용하며, 이는 1/T0과 같습니다.
하지만 주파수의 단위는 무엇일까요?
10은 초당 주기 수이며 시간 단위는 초입니다.
주파수의 단위는 1/초(1초에 1) 또는 과학적 표기법으로는 '초에서 마이너스 1을 뺀 값'입니다.
약간 어색한 단위입니다.
주파수는 매우 중요하기 때문에 일반적으로 '초당'이라고 큰 소리로 말할 수 있는 이 단위를 기록하지 않습니다.
우리는 헤르츠 단위를 사용합니다.
이들은 모두 동일합니다.
주파수의 과학적 단위는 헤르츠입니다.
하지만 항상 '초당 1' 또는 '초에서 마이너스 1'과 정확히 같은 의미라는 점을 기억하세요.
구식 주파수 단위는 사실 '초당 주기'라고 매우 유용하게 사용되었지만 더 이상 사용하지 않습니다.
그렇다면 이러한 신호의 기본 주기와 기본 주파수는 무엇일까요?
동영상을 일시 정지한 상태에서 앉아서 알아보세요.
항상 단위를 알려주는 것을 잊지 마세요.
맨 윗줄에는 1초에 10주기가 있습니다.
따라서 기본 주기는 0.1초이고 F0은 10Hz입니다.
단위가 맞았기를 바랍니다.
오른쪽 위에는 기본 주기가 0.01이고 주파수는 100입니다.
하지만 항상 단위를 써야 합니다!
T0 = 0.01초, F0 = 100Hz입니다.
왼쪽 아래에는 훨씬 더 높은 주파수 신호가 있습니다.
기본 주기는 0.0005초이고 기본 주파수는 2000Hz입니다.
이제 좀 더 과학적인 표기법을 사용할 수 있는데, 수천 헤르츠에 도달하면 Hz의 승수를 말할 수 있기 때문입니다.
2000Hz라고 쓰는 대신 2kHz라고 쓸 수 있습니다.
이것도 마찬가지입니다.
오른쪽 아래는 조금 더 까다롭습니다.
이것은 음성 신호이지만 여기서 기본 주기가 무엇인지 꽤 분명합니다.
여기서부터 여기까지 분명하게 반복되는 패턴을 볼 수 있으므로 T0는 0.005초에 가까워서 200Hz의 F0를 제공합니다.
주기적 신호는 음성에서 음원으로 매우 중요합니다.
음성 인식과 메시지 전달 수단으로서 음성을 더 깊이 이해하는 것에 대해 생각해 보면 주기적 신호는 피치 또는 음악적 음색으로 인식되며, 화자가 메시지의 일부를 전달하는 데 사용할 수 있다는 것을 알 수 있습니다.
피치는 화자가 사용하는 다른 음향적 특징의 일부이며, 이를 통칭하여 prosody라고 부릅니다.
반면에 신호 처리와 음성 신호에 대한 더 깊은 이해, 예를 들어 음성 신호의 모델을 만들기 위해 시간 영역에서 벗어나 주파수 영역으로 이동하면 시간 영역의 매우 특별한 주기적 특성이 주파수 영역에서도 똑같이 특별하고 독특한 특성을 가지고 있음을 알 수 있는데, 이것이 바로 harmonics입니다.The most important source of sound in speech is the periodic vibration of the vocal folds.
Here's a reminder of the two principal sources of sound when producing speech.
Now let's introduce some engineering terms to describe their general properties.
On the left we have voicing.
That's the phonetic term: voicing means the vibration of the vocal folds and that results in a periodic signal.
Periodic signals are predictable.
You could continue the plot on the left and tell me what happens next.
We call this type of signal 'deterministic'.
On the other hand, frication results in a signal that has no periodicity: it's very unpredictable.
So we could say that that is 'aperiodic' or 'non-periodic'.
(They mean the same thing.)
Aperiodic signals are not predictable.
You cannot guess what happens next in the plot on the right.
So we could use some engineering terms.
Periodic signals are 'deterministic': we know what happens next.
Aperiodic or non-periodic signals are 'stochastic': we don't know what happens next, they're random.
Periodic signals are so important, we're going to take a closer look now.
All periodic signals have a repeating pattern.
In this particular signalm it's really obvious what that repeating pattern is.
We can also see exactly how often it repeats: every 0.01 s or 1/100th of a second.
We can use some notation to denote that.
We use the term T0 to denote the fundamental period.
T0 has a dimension of time and a unit of seconds.
Here we can see what T0 is.
It's the time it takes for this signal to repeat.
Here's another signal.
This is a very special signal called a sine wave.
This one has a fundamental period of 0.1 s or 1/10th of a second.
So if we repeated this cycle 10 times, we'd fill up a duration of exactly 1 s.
Another way of talking about the signal is, instead of saying that the fundamental period is 0.1 s, we can say that it has a fundamental frequency of 10.
We'll use the notation F0 to denote fundamental frequency, and that's just going to be equal to 1/T0.
But what are the units of frequency?
10 is the number of periods per second and the units of time are seconds.
The units of frequency are 1/s (1 over seconds) or, in scientific notation, 'seconds to the minus 1'.
That's a little bit of an awkward unit.
Since frequency is so important, we don't normally write down this unit, which we could say out loud as 'per second'.
We give it its own units of Hertz.
These are all equivalent.
The scientific unit of frequency is Hertz.
But just remember, it always means precisely the same as '1 over seconds' or 'seconds to the minus 1'.
The old fashioned unit of frequency was actually very helpfully called 'cycles per second', but we don't use that anymore.
So what are the fundamental periods and the fundamental frequencies of these signals?
Sit down and work them out while you pause the video.
I hope you remembered to always give the units.
In the top row, we've got 10 cycles in one second.
So that's a fundamental period of 0.1 s and we've got then an F0 of 10 Hz.
I hope you got that right, with the units.
Top right, we've got a fundamental period of 0.01 and that gives us a frequency of 100.
But always write the units!
T0 = 0.01 s and F0 = 100 Hz.
Down on the bottom left, we've got a much higher frequency signal.
That's got a fundamental period of 0.0005 s and then it's got a fundamental frequency of 2000 Hz.
We could now use some more scientific notation because once we're into the thousands we could start saying a multiplier for the Hz.
Instead of writing 2000 Hz, we could write 2 kHz.
Those are the same thing.
Bottom right, it's a little bit trickier.
This is a speech signal, but it's pretty obvious what the fundamental period is here.
We can see a clear repeating pattern, and it's going to be from here to here, and so T0 is pretty close to 0.005 s to give us an F0 of 200 Hz.
Periodic signals are very important as a sound source in speech.
Thinking about speech perception and about getting a deeper understanding of speech as a means of communicating a message, we'll find that periodic signals are perceived as having a pitch, or a musical tone, and that can be employed by speakers to convey part of the message.
Pitch is part of a collection of other acoustic features that speakers use, which collectively we call prosody.
Thinking on the other hand about signal processing and about getting a deeper understanding of speech signals, for example, so we can make a model of them, we're going to need to move out of the time domain and into the frequency domain where will see that this very special periodic nature in the time domain has an equally-special, distinctive property in the frequency domain, and that is harmonics.'음성' 카테고리의 다른 글
Module 3 - Digital Signal (0) 2023.08.24 Module 3 - Pitch (1) 2023.08.24 Module 3 - Sound source (0) 2023.08.24 Module 3 - Time domain (0) 2023.08.24 Module 2 - Vowel Space (0) 2023.08.16