close

Вход

Забыли?

вход по аккаунту

?

Патент BY2994

код для вставкиСкачать
ОПИСАНИЕ
ИЗОБРЕТЕНИЯ
К ПАТЕНТУ
РЕСПУБЛИКА БЕЛАРУСЬ
(19)
BY (11) 2994
(13)
C1
(51)
(12)
6
G 10L 3/00
ГОСУДАРСТВЕННЫЙ ПАТЕНТНЫЙ
КОМИТЕТ РЕСПУБЛИКИ БЕЛАРУСЬ
(54)
СПОСОБ ОБНАРУЖЕНИЯ ПОЛЕЗНОГО СИГНАЛА В БЕЛОМ
АДДИТИВНОМ ШУМЕ
(71) Заявитель: СЕКСТАНТ АВИОНИК (FR)
(72) Автор: ПАСТОР Доминик (FR)
(73) Патентообладатель: СЕКСТАНТ
АВИОНИК
(FR)
(21) Номер заявки: 1757
(22) 1994.06.22
(86) PCT/FR92/00504, 1992.06.05
(31) 91/07323
(32) 1991.06.14
(33) FR
(46) 1999.09.30
(57)
1. Способ обнаружения полезного сигнала в белом аддитивном шуме, для которого известно соотношение r0 сигнал/ожидаемый шум обрабатываемого сигнала, заключающийся в измерении параметров шума и
обрабатываемого сигнала в цифровой форме по М и N точкам соответственно, отличающийся тем, что измеряют среднюю энергию шума по М точкам при отсутствии полезного сигнала, среднюю энергию обрабатываемого зашумленного сигнала по N точкам, подсчитывают отношение z энергии обрабатываемого зашумленного сигнала к энергии шума, рассчитывают теоретический порог µ обнаружения, с которым
сравнивают отношение z энергий, и по результатам сравнения судят о наличии либо отсутствии полезного
сигнала.
2. Способ по п.1, отличающийся тем, что теоретический порог обнаружения рассчитывают путем решения для z = µ следующего уравнения:
[z − (r0 + 1)]2 − (z − 1) 2
π
(r + 1)z + k
= ( M / 4)
+ ln 0 ,
2
z+k
π1
z +k
где r — соотношение сигнал/шум,
k = M/N,
π0 — вероятность отсутствия полезного сигнала,
π1 — вероятность присутствия полезного сигнала.
3. Способ по п.1, отличающийся тем, что при обнаружении белого сигнала Гаусса теоретический порог
обнаружения рассчитывают путем решения для z = µ следующего уравнения:
ln
BY 2994 C1
ln[ (r + 1)
3
[z + k (r0 + 1)](z 2 + k ) 2
] = (M / 4)[
[z − (r0 + 1)]2
−
(z − 1) 2
]+ ln π0 .
π1
z + k (r0 + 1)
z +k
(z + k )[z 2 + k (r0 + 1) 2 ] 2
4. Способ по любому из пунктов 1-3, отличающийся тем, что при обнаружении речевого сигнала, кроме
теоретического порога обнаружения используют второй порог решения для учета нестационарного шума,
при этом второй порог меньше теоретического порога обнаружения и соответствует шуму, добавляемому к
стационарному шуму, сравнивают отношение z энергий со вторым порогом и производят замену величины
средней энергии шума величиной средней энергии поступающего сигнала, если отношение z энергий меньше второго порога.
3
2
(56)
Патент США 4 052 568, МПК G 10L 1/04, 1977 (прототип).
2
2
BY 2994 C1
Настоящее изобретение относится к способам обнаружения зашумленного полезного сигнала.
Одна из основных проблем обработки сигнала, простая по своей формулировке, но сложная по своему
решению, заключается в определении наличия или отсутствия полезного сигнала, погруженного в добавочный шум.
Здесь могут быть рассмотрены различные решения. В качестве переменной можно использовать мгновенную амплитуду получаемого или обрабатываемого сигнала по отношению к порогу, определяемому экспериментально.
Можно также использовать в качестве переменной энергию сигнала на временном отрезке продолжительностью Т, устанавливая пороговую величину экспериментальным порядком.
Подобные установления пороговой величины позволяют сделать первое предположение о наличии или
отсутствии сигнала. К тому же они применимы к любому сигналу. Они также дополняются системами «подтверждения», определяющими «почти достоверные» критерии, свойственные типу полезного сигнала, когда
природа последнего известна заранее.
Подобная дополнительная система широко используется при обработке основного тона речевого сигнала
и может заключаться, например, в получении или в оценке минимальной энергии гласной.
Наиболее близким по технической сущности к заявляемому является способ, положенный в основу устройства для обнаружения речевых сигналов при наличии шума в канале связи [1]. Данный способ обнаружения полезного сигнала в аддитивном шуме, для которого заранее известно соотношение сигнал/ожидаемый
шум обрабатываемого сигнала, заключается в измерении параметров шума и обрабатываемого сигнала в
цифровой форме по М и N точкам соответственно. В нем используются, по существу, 3 разных порога, два
из которых регулируются (ТH и TL), если данный процент примеров поступающих сигналов превышает переменный порог шума TL в данный период времени.
Однако данный способ не может обеспечить возможность подсчета значения энергии поступающих сигналов, что, в свою очередь, не позволяет теоретически подойти к проблеме оценки отношения сигнала к шуму и особенно к проблеме обнаружения при наличии белого шума и сигнала, известного лишь энергией в N
точках, когда энергия остается относительно стационарной.
Задачей изобретения является обеспечение возможности обнаружения зашумленного сигнала с наиболее
возможно строгим определением порога обнаружения, который может быть использован также в режиме
саморегулирования. Обнаружение сигнала должно производиться при максимальном правдоподобии.
Для решения поставленной задачи в способе обнаружения полезного сигнала в белом аддитивном шуме,
для которого известно соотношение r0 сигнал/ожидаемый шум обрабатываемого сигнала, заключающийся в
измерении параметров шума и обрабатываемого сигнала в цифровой форме по М и N точкам соответственно, согласно изобретению измеряют среднюю энергию шума по М точкам при отсутствии полезного сигнала, среднюю энергию обрабатываемого зашумленного сигнала по N точкам, подсчитывают отношение z
энергии обрабатываемого зашумленного сигнала к энергии шума, рассчитывают теоретический порог µ обнаружения, с которым сравнивают отношение z энергий, и по результатам сравнения судят о наличии либо
отсутствии полезного сигнала.
При этом теоретический порог обнаружения рассчитывают путем решения для z=µ следующего уравнения:
[z − (r0 + 1)]2 − (z − 1) 2 + ln π0 ,
(r + 1)z + k
= ( M / 4)
z+k
π1
z2 + k
где r - соотношение сигнал/шум,
k=M/N,
π0 - вероятность отсутствия полезного сигнала,
π1 - вероятность присутствия полезного сигнала.
В случае обнаружения белого сигнала Гаусса теоретический порог обнаружения рассчитывают путем
решения для z=µ следующего уравнения:

[z + k(r0 + 1)] (z 2 + k )3 / 2  = (M / 4) [z − (r0 + 1)]2 − (z − 1) 2  + ln π0 .
ln (r + 1)
 2

3/ 2 

π1
 z + k (r0 + 1) 2 z 2 + k 
(z + k ) z 2 + k (r0 + 1) 2


ln =
[
]
Если обнаруживают речевой сигнал, то для учета нестационарного шума, кроме теоретического порога
обнаружения, используют второй порог решения, при этом второй порог меньше теоретического порога обнаружения и соответствует шуму, добавляемому к стационарному шуму, после чего сравнивают отношение z
энергий со вторым порогом и производят замену величины средней энергии шума величиной средней энергии поступающего сигнала, если отношение z энергий меньше второго порога.
Для пояснения сущности изобретения сначала рассмотрено, как проходит теоретически в идеальных условиях обнаружение зашумленного сигнала.
Имеется первая информация u(n) для первого временного отрезка:
u(n)=s(n)+x(n),
2
BY 2994 C1
n - целое число: 0≤n≤N-1,
s(n) - полезный сигнал,
x(n) - шум.
Кроме того, имеется информация у(n) с 0≤n≤M-l, и М может быть равно N или отличаться от него. у(n) это измерение шума x(n) на другом временном отрезке, где нет полезного сигнала.
Установим: U=(u(0)2+u(l)2+...+u(N)2)/N
и
V=(y(0)2+y(1)2+...+y(M)2)/M,
и
Z=U/V.
Таким образом, в идеальном и нереальном случае мы получили бы отношение сигнала к шуму (RSB):
Z=1+RSB
И простой критерий обнаружения был бы:
Z>1: наличие полезного сигнала,
Z<1:отсутствие полезного сигнала.
В соответствии с настоящим изобретением теоретический порог 1 заменяется порогом µ подсчитанным
способом, приведенным выше, где учитывается тот факт, что сигналы, которыми располагают, не являются
вполне эргодическими и что U и V являются лишь оценками настоящих значений дисперсий σ 2u и σ 2x .
Для определения µ действуют следующим образом.
Допускается, что переменные U и V являются случайными и что, следовательно, Z тоже случайно. Подсчитывается плотность вероятности Z, которая зависит от отношения сигнала к шуму.
Затем, используя принцип максимума правдоподобия, определяется лучшая оценка отношения сигнала к
шуму после подсчета переменной Z.
С этой целью измеряют на временном отрезке переменную U(n), упомянутую выше, и измеряют переменную у(n) на другом временном отрезке, где есть уверенность, что там нет полезного сигнала, а лишь
только шум (независимый и декоррелированный от s(n)).
Чтобы определить плотность случайной переменной Z (которую можно обозначить как наблюдаемую переменную), действуют следующим образом. Допустим, X1 принадлежит к N(m1;σ12), а X2 принадлежит к
N(m2; σ22) две случайных гауссовых независимых переменных, для которых вероятности Pr {Х1<0} и Pr
{Х2<0} оказываются практически равными нулю.
Установим: m=m1/m2, σ2=σ12/σ22, α=m2/σ2.
Плотность вероятности fx(x) от Х составит:
α 2 ( x −m ) 2
− ⋅ 2 2
1
mx + σ 2
e 2 x +σ ⋅ U ( x ) ,
f x ( x ) = ( ) −1 / 2
2π
(x 2 + σ 2 ) 3 / 2
где U(x)=1 при x≥0 и U(x)=0 при x<0.
Если
x−m
h (x ) = α ⋅
,
2
( x + σ 2 )1 / 2
то имеем: Р(x)=Pr{Х<x}=F[h(x)], выражение, в котором F(x) обозначает характеристическую функцию
нормализованной гауссовой переменной.
Теперь допускаем, что сигналы s(n), x(n) и у(n) - это белые гауссовы сигналы, направленные к центру.
Установим σs2=E[s(n)2]
σx2=E[x(n)2]=E[y(n)2]⋅u(n)=s(n)+x(n).
Последний член имеет те же характеристики, что и вышеназванные сигналы;
и установим σu2=E[u(n)2]=σs2+σx2.
Поскольку мы определяем σs2 и σx2, то предполагается, что подсчет плотности и вероятности происходит
при известных σs2 и σx2. Таким образом, плотность Z определяется с учетом σs2 и σx2.
В этом случае U и V подчиняются законам chi-2 и при достаточно больших N и М, U и V аппроксимируются законами Гаусса, практически всегда положительными:
U принадлежит к N (σu2; 2σu4/N), а V - к N (σx2; 2σx4/М).
Z является, таким образом, отношением двух гауссовых переменных. Можно легко доказать, что U и V
независимы
С: m1=σu2, σ12=2σu4/N, m2=σx2, σ22=2σx4/M.
Получаем: m=σu2/σx2, σ2=(M/N) (σu2/σx2)2, α=(M/2)1/2.
Итак, σu2/σx2=1+r, где r=σs2/σx2 является отношением сигнала к шуму.
Если k=M/N, то m=r+1, σ2=k(r+1)2.
3
BY 2994 C1
Плотность вероятности Z при известных σs2 и σx2 выражается, следовательно, через:
1*) x≥0
f z (z : σ s2 , σ 2x ) = (M / 4π)1 / 2 (r + 1)
fz(z:σs2,
2*) x≤0,
Установим:
z + k (1 + r )
[z 2 + k (r + 1) 2 ]3 / 2
−
M[ z − ( r +1)] 2
2
2
e 4[ z + k ( r +1) ]
σs2)=0.
f k , M(z, r ) = (M / 4π)1/ 2 (r + 1)
z + k (1 + r )
2
2 3/ 2
[z + k ( r + 1) ]
−
M[ z −( r +1)]2
2
2
e 4[z +k (r +1) ] ⋅ U(z) .
Таким образом, что fz(z: σs2, σx2)=fk,M(z, σs2/σx2).
На основании вышеприведенных результатов, касающихся плотности вероятности fx(x), определяем вероятность:
Pr,{Z<z: σs2, σx2}.
Или:
x − (r + 1)
h k ⋅M ( x , r ) = (M / 2)1 / 2
.
2
[ x + k (r + 1) 2 ]1 / 2
Отсюда вытекает: Pr{Z<z: σs2; σx2}=F{hk, M(x,r)}.
Теперь рассмотрим случай какого-то сигнала s(n) и белого шума Гаусса.
Все также предполагаем, что шумы x(n) и у(n) являются белыми шумами Гаусса с
σx2=E[x(n)2]=E[y(n)2].
Предполагается, что есть какой-то полезный сигнал s(n), независимый от шума.
Новая гипотеза, выдвигаемая здесь, заключается в том, что s(n) и х(n) не являются коррелируемыми во
временном смысле термина, т. е.:
c=
(
∑
∑ 0 ≤ n ≤ N − 1 s(n )x ( n )
=0.
∑ 0 ≤ n ≤ N − 1 x (n) 2 )1 / 2
0 ≤ n ≤ N − 1 s(n ) 2 )1 / 2 (
Теперь доказывается, что U может быть аппроксимировано через
U=µs2+(1/N)Σ0≤n≤N-1 x(n)2, a Z через:
Z=
∑ 0 ≤ n ≤ N − 1 x (n ) 2 .
(1 / M )∑ 0 ≤ n ≤ M − 1 y(n ) 2
µ s2 + (1 / N)
Точно так же, как определено выше, подсчет плотности Z осуществляется при известных σs2 и σx2, здесь
подсчет производится при известных µs2 и σx2.
Определяемая плотность выражается через fz(z: µs2, σx2).
При известных µs2, U=µs2+(1/N)Σ0≤n≤N-1 x(n)2
Принадлежит к N (µs2+σx2;(2/N)σx4)
V принадлежит к N (σx2;(2/M)σx4).
Таким образом, Z=U/V приближено отношением двух независимых законов Гаусса.
Так как U и V независимы, то применяем результат, относящийся к плотности вероятности Х с:
m1=µs2+σx2, σ12=(2/N)σx4, m2=σx2, σ22=(2/M)σx4.
Следовательно: m=r+l, σ2=k, α=(M/2)1/2 с k=M/N и r=µs2/σx2.
Плотность вероятности Z при известных µs2 и σx2, следовательно, составляет:
M [ z − ( r +1)] 2
(1 + r )z + k − 4
f z (z : µ s2 , σ 2x ) = (M / 4π)1 / 2
e
[ z 2 + k ]3 / 2
Установим:
z2 +k
⋅ U(z) .
M [ z − ( r +1)] 2
(1 + r )z + k − 4 z 2 + k
⋅ U(z)
e
f k , M (z) = (M / 4π)
[z 2 + k ]3 / 2
так что: fz(z: σs2, σx2)=fk, M(z, σs2/σx2).
Hа основании полученных выше результатов, касающихся плотности вероятности X, получаем вероятность:
Pr{Z<z: µs2, σx2}.
Или:
x − (r + 1)
h k , M ( x , r ) = (M / 2)1 / 2
.
[ x 2 + k ]1 / 2
1/ 2
4
BY 2994 C1
Отсюда вытекает: Pr{Z<z: µs, σx2}=F{hk, M(x,r)}.
В соответствии с настоящим изобретением обнаружение сигнала производится при максимальном правдоподобии.
В случае с обрабатываемыми сигналами плотность вероятности переменной Z, охватывающей энергию
полезного сигнала и шума, выражается функцией формы: fk, M(z, r), где r обозначает отношение сигнала к
шуму. Следовательно, эта вероятность зависит от отношения сигнала к шуму. Также правило решения может
быть применимо лишь к отношению сигнала к ожидаемому шуму. Таким образом, r0 выражает это отношение.
Предполагается, что вероятность отсутствия s(n) составляет π0 и что вероятность присутствия s(n) составляет π1.
Поскольку плотность вероятности fk,M(z,r) известна, то правило оптимального решения определяется
общей теорией обнаружения и выражается через:
π1 f k , M (z, r0 )
> 1 →D=1,
π 0 f k , M (z,0)
π1 f k , M(z, r0 )
< 1 →D=0.
π 0 f k , M (z,0)
Это правило решения может быть также выражено в виде: (Z<µ→D=0) и (Z>µ→D=1).
Теперь следует определить и решить уравнение:
1n[fk,M(z,r0)]-1n[fk,M(z,0)]-1n(π0/π1)=0.
Теперь доказываем, что вероятность ошибки составляет:
Pe=π0[1-F(hk,M(µ,0))]+π1F(hk,M(µ,r0)).
Теперь рассмотрим случай обнаружения белого сигнала Гаусса в белом шуме Гаусса.
Допустим, что s(n), x(n) и у(n) являются белыми гауссовыми сигналами, направленными к центру. r0 является отношением сигнала к ожидаемому шуму, a k=M/N. Вероятность отсутствия s(n) составляет π0, а вероятность присутствия s(n) составляет π1.
Тогда правило решения выглядит следующим образом:
Решение D=1, когда:

 [z − (r0 + 1)]
π
[z + k (r0 + 1)](z + k ) 
(z − 1) 
−
1n (r + 1)
 > ( M / 4)  2
 + 1n 0 ;
2
2 3/ 2
2
2
π1
(z + k )[z + k (r0 + 1) ]
z + k 


 z + k (r0 + 1)
Решение D=0, когда:
 [z − (r + 1)]2

π
[z + k (r0 + 1)](z 2 + k ) 3 / 2 
(z − 1) 2 
0
< (M / 4) 
−
1n (r + 1)

 + 1n 0 .
2
2 3/ 2
2
2
2
π1
(z + k )[z + k (r0 + 1) ]
z + k 


 z + k (r0 + 1)
Порог определяется равенством (вместо неравенства) между членами двух выражений.
Правило решения может быть также выражено в форме:
(Z<µ→D=0) и (Z>µ→D=1).
Например, получаем для µ при М=N=128, π0=π1=1/2:
r0 в dB
µ
-2
1,27
-1
1,34
0
1,41
1
1,50
2
1,68
Вероятность ошибки составляет:
Pe=π0[1-F(hk,M(µ,0))]+π1F(hk,M(µ,r0))
с:
x − (r + 1)
.
h k , M ( x , r ) = (M / 2)1 / 2
2
[ x + k (r + 1) 2 ]1 / 2
Здесь приведены некоторые значения Ре в зависимости от r0.
π1 и π0 считаются равными 0,5.
r0 в dB
Pе
-2
0,086
-1
0,052
0
0,028
1
0,013
2
0,005
5
BY 2994 C1
В примере моделирования был порожден белый шумы Гаусса с дисперсией устройства. На каждый кадр
из 128 точек (N=М=128) решили не без некоторого риска генерировать добавочный шум s(n), выражающий
отношение сигнала к шуму, определенному заранее. Вероятность появления и отсутствия (π0 и π1) равна 0,5.
Был генерирован второй белый шум Гаусса с дисперсией устройства, что позволило подсчитать случайную
переменную V. Для каждого кадра подсчитали Z. Затем применили правило решения и подсчитали количество ошибок.
r0 в dB
Количество ошибок на 1000 операций
-2
73
-1
43
0
18
1
10
2
2
Эти результаты подтверждают теоретические расчеты.
Теперь рассмотрим случай какого-то сигнала s(n) и белого шума Гаусса.
Предполагается, что x(n) и у(n) - белые шум Гаусса при σx2=E[x(n)2]=E[y(n)2].
Имеется какой-то полезный сигнал s(n), независимый от шума. r0 является отношением сигнала к ожидаемому шуму, a k=M/N. Вероятность отсутствия s(n) составляет π0, а вероятность присутствия s(n) составляет π1.
Решение D=1, когда:
[z − (r0 + 1)]2 − (z − 1) 2
π
(r + 1)z + k
> ( M / 4)
+ 1n 0 .
2
z+k
π1
z +k
Решение D=0, когда:
1n
[z − (r0 + 1)]2 − (z − 1) 2
π
(r + 1)z + k
< ( M / 4)
+ 1n 0 .
2
π1
z+k
z +k
Правило решения может быть также выражено в форме:
(Z<µ→D=0) и (Z>µ→D=1).
Например, получаем для µ в зависимости от r0 при М=N=128, π0=π1=1/2
r0 в dB
µ
-2
1,30
-1
1,38
0
1,48
1
1,60
2
1,76
Вероятность ошибки составляет:
Pe=π0[1-F(hk,M(µ,0))]+π1F(hk,M(µ,r0))
с:
x − (r + 1)
.
h k , M ( x , r ) = (M / 2)1 / 2
[ x 2 + k ]1 / 2
Здесь мы приводим некоторые значения Ре в зависимости от r0.
π1 и π0 считаются равными 0,5.
1n
r0 в dB
Ре
-2
-1
0,062
0,032
0
1
2
0,013
0,004
0,001
В примере моделирования для каждого кадра из 128 точек (N=М=128) было решено не без некоторого
риска добавить s(n), который представляет здесь синусоиду, выражающую отношение сигнала к шуму, определенному заранее. Вероятность появления и отсутствия (π1 и π0) равна 0,5. Был генерирован второй белый
шум Гаусса с дисперсией устройства, что позволило подсчитать случайную переменную V. Для каждого
кадра подсчитали Z. Затем применили правило решения, упомянутое выше, и подсчитали количество ошибок.
6
BY 2994 C1
r0 в dB
-2
-1
0
1
2
Количество ошибок на 1000 операций
70
37
12
6
3
Эти результаты подтверждают теоретические расчеты.
Предыдущие результаты, являясь очень общими, позволяют осуществить обнаружение сигналов, утонувших в добавочном шуме, даже если отношение сигнала к шуму слишком мало, около 0 дБ.
Ниже описана область применения, в которой этот вид обнаружения может оказаться очень полезным.
Представленные алгоритмы используются для речи, рассматриваемой как предсистема обнаружения речевой деятельности.
Выбор порога обнаружения зависит от контекста.
В том, что касается используемых аудио полос, то предварительная характеристика шума в речи, выполненная с помощью измерений, основанных на оценке по максимуму правдоподобия, показывает, что обнаруживаемый речевой сигнал представляет собой отношение сигнала к шуму по крайней мере 6 дБ.
С другой стороны, в системе обработки используются полосы сигнала в 128 точек при частоте выборки
10 кГц.
Переменные U и V оцениваются по 128 точкам, так что М=N=128.
На основании вышеизложенного определяется теоретический порог обнаружения -3.
Однако этого единственного порога недостаточно. В действительности, если шум относительно стационарен, то в нем есть и нестационарности, которые следует учитывать для обновления переменной V, что позволяет лишь частично использовать алгоритм.
Следовательно, необходимо введение второго порога, который позволит решить, следует или нет обновлять переменную V.
Второй порог устанавливается в 1,25, что соответствует дополнительному шуму, налагающемуся на стационарный, с отношением сигнала к шуму - 2 дБ.
Правило решения будет следующим:
Если Z<1,25:
В таком случае обрабатываемый кадр состоит из того же шума, что и кадр-эталон. Переменная V заменяется значением энергии обрабатываемого кадра.
Следует отметить, что поскольку решение заключается в подходе к обрабатываемому кадру как к представительному шуму, то можно обновить переменную V, определив среднюю бывшего значения V и энергии
исследуемого кадра. Это приведет к изменению значения М (количество точек, по которым оценивается V),
но подобная операция может отрицательно сказаться на благоприятном использовании алгоритма.
Если 1,25<Z>3:
Кадр рассматривается как содержащий нестационарность шума при отсутствии речевого сигнала.
Если 3<Z:
Это кадр с речевым сигналом.
Опыты на образцах зашумленных сигналов подтвердили это обнаружение.
Однако напомним, что это обнаружение речевого сигнала может быть улучшено путем использования собственных критериев речевого сигнала, таких как подсчет основного тона речевого сигнала.
Предлагаемый здесь алгоритм касается исследования некоторых примеров сигналов. Очевидно, что для
других сигналов речи, представляющих различные отношения сигнала к шуму, необходимо осуществить новый отбор порогов.
Обычно предпочитают использовать два порога.
Использование этого алгоритма позволяет создать надежные справочные файлы для системы обнаружения речевого сигнала. В таком случае является необходимой точная сегментация сигнала.
В одном из исследований использовали чередование с микрофоном (включение и отключение), что позволило произвести грубую сегментацию речевого сигнала.
Предыдущий алгоритм был использован для совершенствования этого чередования. Первый прогон алгоритма позволил уточнить начало сигнала. Второй прогон состоял в чтении речевого сигнала «наоборот», т.
е. от выключения микрофона к его включению. Благодаря этому можно было установить конец сигнала.
Подобное использование алгоритма является необходимым, так как обнаружение сигнала в этом случае
является достаточно точным, чтобы обнаружить наличие пауз (молчаний) внутри слов, что отрицательно
влияет на сегментацию в ходе исследований.
Таким же способом можно сегментировать речевые файлы, на которых проводится исследование.
7
BY 2994 C1
Однако, этот алгоритм не является каузальным, что отрицательно сказывается на его использовании в реальное время. Возникает необходимость дополнить алгоритм подсчетом, свойственным обработке речи.
Таким образом доказано существование оптимальных порогов обнаружения, что позволяет теоретически
подойти к проблеме оценки отношения сигнала к шуму и особенно к проблеме обнаружения при наличии
белого шума и сигнала, известного лишь энергией в N точках, когда энергия остается относительно стационарной.
Государственный патентный комитет Республики Беларусь.
220072, г. Минск, проспект Ф. Скорины, 66.
Документ
Категория
Без категории
Просмотров
0
Размер файла
161 Кб
Теги
by2994, патент
1/--страниц
Пожаловаться на содержимое документа