close

Вход

Забыли?

вход по аккаунту

?

Основы спектрального анализа

код для вставкиСкачать
Основы
спектрального
анализа
звуков
Часть 1.
Ряды Фурье.
В векторной алгебре
скалярное произведение пары трёхмерных векторов a и b
определяется одним из следующих равнозначных способов:
( a , b ) a b cos ab
( a , b ) a1b1 a 2 b2 a 3b3
Назовём ортонормированным базисом в трёхмерном векторном
пространстве такую тройку векторов {e1,e2,e3}, для которых
справедливы следующие соотношения:
1, если n k
(en , ek ) 0 , если n k
a = a1 . e1 + a2 . e2 + a3 . e3 =
= (a,e1) . e1 + (a,e2) . e2 + (a,e3) . e3
Обозначим пару оцифрованных звуковых сигналов
следующим образом:
s(t) => {s1, s2, s3, …, sN}
z(t) => {z1, z2, z3, …, zN}
Их скалярное произведение определим по
аналогии для векторов a и b :
( a , b ) a1b1 a 2 b2 a 3b3
( s ( t ), z ( t )) s1 z1 s 2 z 2 s 3 z 3 ... s N z N N
s
n 1
N
( s ( t ), z ( t )) s
n 1
n
z n s ( t ) z ( t ) dt
n
zn
Определение 1.
Скалярным произведением двух функций на интервале
[ T0 / 2 ; T0 / 2 ]
называется:
( s ( t ), z ( t )) 2
T0
T0 / 2
s ( t ) z ( t ) dt
T0 / 2
Определение 2.
Две функции называются ортогональными,
если их скалярное произведение
равно нулю:
( s ( t ), z ( t )) 0
Определение 3.
Функция s(t)
называется нормированной на 1,
если:
( s ( t ), s ( t )) 1
Определение 4.
Назовём
ортонормированным базисом
такую бесконечную совокупность функций
{e1(t), e2(t), e3(t), …, en(t), …},
для которых выполняются следующие условия:
( e n ( t ), e k ( t )) nk
1, если n k
0 , если n k
Определение 5.
Назовём координатой
an
функции s(t)
в функциональном бесконечномерном
ортонормированном базисе
такое число:
T0 / 2
2
a n ( s ( t ), e n ( t )) s ( t ) e n ( t ) dt
T0 T / 2
0
Эта аналогия взята из разложения векторов в
ортонормированном базисе векторов:
a = a1 . e1 + a2 . e2 + a3 . e3 =
(a,e1) . e1 + (a,e2) . e2 + (a,e3) . e3
Введём базис из гармонических функций:
n
c n ( t ) cos( 2 t ), где n 0 ,1, 2 , 3,...
T0
H k
s k ( t ) sin( 2 t ), где k 1, 2 , 3,...
T0
1.50
1.00
c1 ( t )
H1 s1 ( t )
0.50
0.00
-0.50
-1.00
-1.50
cos
sin
Введём базис из гармонических функций:
n
c n ( t ) cos( 2 t ), где n 0 ,1, 2 , 3,...
T0
H k
s k ( t ) sin( 2 t ), где k 1, 2 , 3,...
T0
1.50
1.00
c2 (t )
H2 s2 (t )
0.50
0.00
-0.50
-1.00
-1.50
cos
sin
Введём базис из гармонических функций:
n
c n ( t ) cos( 2 t ), где n 0 ,1, 2 , 3,...
T0
H k
s k ( t ) sin( 2 t ), где k 1, 2 , 3,...
T0
1.50
1.00
c3 ( t )
H3 s3 ( t )
0.50
0.00
-0.50
-1.00
-1.50
cos
sin
Введём базис из гармонических функций:
n
c n ( t ) cos( 2 t ), где n 0 ,1, 2 , 3,...
T0
H k
s k ( t ) sin( 2 t ), где k 1, 2 , 3,...
T0
1.50
1.00
c4 (t )
H4 s4 (t )
0.50
0.00
-0.50
-1.00
-1.50
cos
sin
Введём базис из гармонических функций:
n
c n ( t ) cos( 2 t ), где n 0 ,1, 2 , 3,...
T0
H k
s k ( t ) sin( 2 t ), где k 1, 2 , 3,...
T0
1.50
1.00
c5 ( t )
H5 s5 ( t )
0.50
0.00
-0.50
-1.00
-1.50
cos
sin
1.50
1.00
c1 ( t )
H1 s1 ( t )
0.50
cos
0.00
sin
-0.50
-1.00
-1.50
1.50
1.00
c2 (t )
H2 s2 (t )
0.50
cos
0.00
sin
-0.50
-1.00
-1.50
1.50
1.00
c3 ( t )
H3 s3 ( t )
0.50
cos
0.00
sin
-0.50
-1.00
-1.50
1.50
1.00
c4 (t )
H4 s4 (t )
0.50
cos
0.00
sin
-0.50
-1.00
-1.50
1.50
1.00
c5 ( t )
H5 s5 ( t )
0.50
cos
0.00
sin
-0.50
-1.00
И так далее…
-1.50
…до бесконечности…
Ортонормированный базис из гармонических функций:
n
c n ( t ) cos( 2 t ), где n 0 ,1, 2 , 3,...
T0
H k
s k ( t ) sin( 2 t ), где k 1, 2 , 3,...
T0
Все функции этого базиса ортонормированны:
c n ( t ), s k ( t ) 2
T0
T0 / 2
cos( 2
T0 / 2
1, если n k
c n ( t ), c k ( t ) 0 , если n k
Использовать формулы:
n
T0
t ) sin( 2
k
t ) dt
T0
c n ( t ), s k ( t ) 0
1, если n k
s n ( t ), s k ( t ) 0 , если n k
2 cos( A ) cos( B ) cos( A B ) cos( A B )
2 sin( A ) sin( B ) cos( A B ) cos( A B )
Определение 6.
Пусть для функции s(t) существует интеграл:
T0 / 2
s ( t ) dt
T0 / 2
Рядом Фурье, порождённым этой действительной функцией s(t),
называется бесконечный тригонометрический ряд:
Ф (t ) 1
2
a0 a
n
c n (t ) bn s n (t ) n 1
где коэффициенты определяются по формулам Эйлера-Фурье:
a n s ( t ), c n ( t ) bn s ( t ), s n ( t ) Теорема Фурье
Если функция
s (t )
непрерывна на интервале
[ T0 / 2 , T0 / 2 ],
и для неё существует интеграл
T0 / 2
s ( t ) dt ,
T0 / 2
то порождённый этой функцией ряд Фурье
Ф (t )
равен порождаемой функции
s (t ).
То есть,
Ф ( t ) s ( t ).
В полном виде
коэффициенты (“координаты”) an и bn
определяются по формулам
Эйлера-Фурье:
a n s ( t ), c n ( t ) bn s ( t ), s n ( t ) 2
T0
2
T0
T0 / 2
s ( t ) cos( 2
T0 / 2
T0 / 2
t ) dt
T0
T0 / 2
n
s ( t ) sin( 2
n
T0
t ) dt
В кратком виде ряд Фурье выглядит так:
Ф (t ) 1
2
a0 a
n
c n ( t ) bn s n ( t ) n 1
А в полном виде - так:
Ф (t ) 1
2
a0 (a
n
cos( 2 n
T0
n 1
t ) b n sin( 2 n
t ))
T0
Используя тригонометрическую формулу:
a cos( x ) b sin( x ) a b sin( x arctg
2
2
Ф (t ) 2
где:
An a0 A
n 1
2
a n bn
2
n
sin( 2 )
b
получим:
1
a
n
T0
t n)
an n arctg bn Ф (t ) 1
2
1
2
где:
a0 A
n
sin( 2 T0
n 1
a0 A
n
cos( 2 2
a n bn
n
T0
n 1
An n
t n) t n )
2
an n arctg bn 2
Или в общем виде:
Ф (t ) 1
2
a0 A
n 1
n
cos( 2 n
T0
t n)
Сделаем замену: F0 1
T0
Теперь ряд Фурье принимает вид:
Ф (t ) 1
2
a0 A
n
cos( 2 ( n F0 ) t n )
n 1
Ряд Фурье - это математическая частотная модель
фрагмента звукового сигнала на заданном временном интервале.
{ A1 , A2 , A3 , A4 ,..., An ,...} амплитудны
й _ спектр ;
{ 1 , 2 , 3 , 4 ,..., n ,...} фазовый _ спектр .
Амплитуда
Амплитудный спектр
O
F
2F
3F
4F
5F
6F
7F
8F
9F
10F
11F
12F
13F
14F
Частоты гармоник
Это графическая форма представления
математической частотной модели
фрагмента звукового сигнала
на заданном временном интервале.
Основы
спектрального
анализа
звуков
Часть 2.
Адекватность рядов Фурье.
О периодичности функции Ф(t)
Ф (t ) 1
2
a0 A
n
n
cos( 2 T0
n 1
t n)
Функция f(t) была нами определена на интервале:
T0
t
2
Как эта функция: Ф ( t ) T0
2
1
2
a0 A
n
cos( 2 n 1
(но не сама порождающая функция s(t))
ведёт себя вне этого интервала?
Функция Ф(t) периодична или нет?
n
T0
t n)
Ф (t ) 1
2
a0 A
n
cos( 2 n
T0
n 1
t n)
Сложная функция Ф(t), представленная этим рядом,
периодична.
И её период равен kT0.
Доказательство:
1
2
1
2
a0 A
n
cos( 2 T0
n 1
a0 A
n
cos( 2 2
( t kT 0 ) n )
n
T0
n 1
1
n
a0 A
n 1
n
cos( 2 t 2 nk n )
n
T0
t n)
О периодичности
-3T/2
-T/2
T/2
3T/2
Адекватность рядов Фурье
• Внутри интервала [-T/2;T/2] – всегда. Какова бы ни была
непрерывная функция s(t) на интервале [-T/2;T/2], порождённый
ею ряд Фурье всегда адекватно описывает эту функцию внутри
этого интервала.
• Если функция s(t) строго периодична, то её модельное
(математическое) описание с помощью ряда Фурье на интервале
одного периода, адекватно описывает эту функцию не только
внутри интервала [-T/2;T/2], но и вне его.
• Следствие. Если исходный функция – это гармоническая функция, то ряд
Фурье будет состоять только из одной пары базисных функций.
• Адекватной моделью функции импульсного типа (импульсного
сигнала) является ряд Фурье на бесконечном временном
интервале [-∞;+∞]. То есть, когда T →∞.
Основы
спектрального
анализа
звуков
Часть 3.
Принцип неопределённости
Гейзенберга.
Так выглядит идеальный (теоретический) спектр
строго периодического сигнала:
Амплитуда
Амплитудный спектр
O
F
2F
3F
4F
5F
6F
7F
8F
9F
10F
11F
12F
13F
14F
Частоты гармоник
Это графическая форма представления математической частотной модели
фрагмента звукового сигнала на заданном временном интервале.
Гармоника – атомарный информационный объект звука:
s ( t ) A0 cos( 2 F0 t 0 )
A(f)
Ее
амплитудный
спектр:
A0
F0
f
Сигнал, равный сумме 2-х гармоник:
s ( t ) A1 cos( 2 F1t 1 )
A2 cos( 2 F2 t 2 )
A(f)
Их
амплитудный
спектр:
A1
A2
f
F1
F2
Но это все справедливо теоретически для спектров
бесконечно длинных гармоник
Реально же требуется находить спектры гармоник,
на которые раскладываются речевые сигналы,
на очень маленьких временных промежутках
(интервалах, окнах).
Например, на интервалах, по длительности не
превышающих время звучания одной фонемы или
одного периода голосовых импульсов.
(тут-то и возникают проблемы…)
Нарезка на кадры одиночной гармоники
Границы кадров
Амплитудный (логарифмический) спектр отдельного
кадра предыдущего сигнала
Истинное значение частоты F0 и
амплитуды A0
Артефакты
Артефакт
[лат. arte искусственно + factus сделанный] – биол.
образования или процессы, возникающие иногда
при исследовании биологического объекта
вследствие воздействия на него
самих условий исследования.
А как бы выглядел спектр на предыдущем слайде, если
бы прямоугольное окно вырезало бы целое число
периодов гармонического сигнала?
Вспомнить о ряде Фурье.
Нарезка на кадры
с помощью гладких окон
Границы кадров
Амплитудный (логарифмический) спектр
отдельного кадра, вырезанного с помощью
гладкого окна
Истинное значение
частоты F0 и амплитуды A0
Артефакты
Амплитудный
спектр
одиночной
гармоники
При неправильном
выборе параметров
спектрального анализ
можно получить
ложные следы
(артефакты)
Амплитудный спектр
обертонов голоса
(звук «о» в «fourzero»)
Окно Гаусса (почти) не
порождает артефакты
Временное окно Гаусса артефактов не создает
t
tкадра
- полуширина временного окна
Гаусса это же расстояние и
между кадрами
время
Спектр (линейный, а не логарифмический) одиночной
гармоники, полученной при использовании окна Гаусса:
A0
F0
f
- полуширина спектра
одиночной гармоники
частота
Принцип неопределенности Гейзенберга:
2 t
f
1
Если построить спектральный фильм
с шириной кадров:
t
то гармоники,
различающиеся по частоте, менее, чем на
f
будут неразличимы.
Их следы на спектре (сонограмме) сольются.
Показать на примере.
Звуковой сигнал, состоящий из
суммы нескольких гармоник:
Спектр предыдущего звукового сигнала,
полученного с помощью очень маленького
временного окна Гаусса
Спектр предыдущего звукового сигнала,
полученного с помощью чуть большего
временного окна Гаусса
Спектр предыдущего звукового сигнала,
полученного с помощью еще чуть большего
временного окна Гаусса
Спектр предыдущего звукового сигнала,
полученного с помощью еще большего
временного окна Гаусса
Спектр предыдущего звукового сигнала,
полученного с помощью большого временного
окна Гаусса
Сонограмма предыдущего звукового сигнала, полученного с
помощью большого временного окна Гаусса
Единственными (квази)гармоническими компонентами в речевом
сигнале являются затухающие гармоники, возникающие в
резонаторе (в речевом тракте) после хлопка голосовых связок.
Взаимное расположение частот этих затухающих гармоник и
определяет формантную структуру речевого сигнала.
Форма свободно затухающего гармонического колебания.
Спектр одного кадра в середине предыдущего
сигнала:
Резонансная частота (реальный практический спектр).
Резонансная частота (идеальный теоретический спектр).
Отрезок реального речевого сигнала между двумя соседними
импульсами (хлопками) голосовых связок.
Примерное положение
голосового импульса.
Отклик резонаторов речевого тракта (РТ) н
голосовой импульс возбуждения РТ.
Спектр одного маленького кадра
в середине предыдущего сигнала:
Реальный практический спектр)
Резонансные частоты речевого тракта
(идеальный теоретический спектр)
Общие рекомендации по визуализации резонансных
частот (формант) речевого тракта:
Частота кадров спектрального фильма должна быть на
порядок (раз в 10) больше частоты работы голосовых
связок.
Но увеличивать частоту кадров спектрального фильма
до бесконечности нельзя, поскольку из-за принципа
неопределенности Гейзенберга следы формант на
сонограмме начнут сливаться.
Основы
спектрального
анализа
звуков
Часть 4.
Преобразование Фурье.
Реалии: каким бы ни был анализируемый звук (речевой
сигнал) он всегда разбивается на отдельные временные
кадры для анализа спектрального гармонического состава
звука в этом кадре.
Это приводит к тому, что строится спектр не всего
звукового сигнала, а его выделенной части внутри кадра.
Из-за этого отдельный кадр сигнала фактически
оказывается изолированным импульсом сложной формы.
Адекватной математической частотной моделью
функции импульсного типа (импульсного сигнала)
является ряд Фурье
на бесконечном временном интервале [-∞;+∞].
То есть, когда T →∞.
В классическом виде ряд Фурье выглядит так:
Ф (t ) 1
2
где:
a0 (a
n
n
cos( 2 T0
n 1
a n s ( t ), c n ( t ) bn s ( t ), s n ( t ) 2
T0
2
T0
t ) b n sin( 2 T0 / 2
s ( t ) cos( 2
t ))
T0
t )dt
T0
T0 / 2
T0 / 2
n
n
s ( t ) sin( 2
T0 / 2
n
t )dt
T0
Если T0 устремить к бесконечности, то спектр из дискретной формы
переходит в континуальную. И при этом производятся замены:
n
T0
n F0 f
an a ( f )
bn b ( f )
Вместо ряда Фурье получается интеграл Фурье:
Ф (t ) ( a ( f ) cos( 2 f t ) b ( f ) sin( 2 f t )) df
0
Здесь знак суммы заменён на знак интеграла.
Вместо коэффициентов an и bn теперь будут функции a(f) и b(f):
a( f ) s ( t ) cos( 2 ft )dt
s ( t ) sin(
b( f ) 2 ft )dt
Произведём замену:
S ( f ) S ( f ) *
1
2
( a ( f ) ib ( f )) s(t ) e
i 2 ft
Заменяя в верхней формуле a(f) и b(f) на S(f),
получим преобразование Фурье:
dt
Теперь уже на ряд, а интеграл Фурье:
Ф (t ) S( f )e
i 2 ft
df
Поскольку Ф(t)=s(t), то получаем:
S( f ) s(t ) e
i 2 ft
dt
- прямое преобразование Фурье,
df
- обратное преобразование Фурье.
s(t ) S( f )e
i 2 ft
Упрощенная запись спектра:
S ( f ) F [ s ( t )]( f ) Re( f ) i Im( f )
S ( f ) F [ s ( t )]( f ) A ( f ) e
A( f ) Re ( f ) Im ( f )
2
2
Im( f ) ( f ) arctg Re( f ) i ( f )
- амплитудный спектр
- фазовый спектр
Логарифмический спектр
S ( f ) F [ s ( t )]( f ) A ( f ) e
i ( f )
log( S ( f )) log( A ( f )) i ( f )
Амплитудный спектр
в логарифмическом
масштабе (дБ)
Фазовый спектр в
радианах
Фурье-преобразование переводит сигнал из
физического пространства в информационное:
s(t ) S ( f )
Основы
спектрального
анализа
звуков
Конец.
Документ
Категория
Презентации
Просмотров
108
Размер файла
1 120 Кб
Теги
1/--страниц
Пожаловаться на содержимое документа