close

Вход

Забыли?

вход по аккаунту

?

Патент РФ 2335022

код для вставки
РОССИЙСКАЯ ФЕДЕРАЦИЯ
(19)
RU
(11)
2 335 022
(13)
C2
(51) МПК
G10L 19/14 (2006.01)
G11B 20/12 (2006.01)
ФЕДЕРАЛЬНАЯ СЛУЖБА
ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ,
ПАТЕНТАМ И ТОВАРНЫМ ЗНАКАМ
(12)
ОПИСАНИЕ ИЗОБРЕТЕНИЯ К ПАТЕНТУ
(21), (22) За вка: 2006105203/09, 13.07.2004
(24) Дата начала отсчета срока действи патента:
13.07.2004
(30) Конвенционный приоритет:
21.07.2003 DE 10333071.2
27.08.2003 DE 10339498.2
(43) Дата публикации за вки: 27.06.2006
(56) Список документов, цитированных в отчете о
поиске: WO 02/086894 A1, 31.10.2002. US
6466476 A, 15.10.2002. EP 1005044 A1,
31.05.2000. RU 95122700 A, 20.10.1997. US
5642338 A, 24.06.1997.
2 3 3 5 0 2 2
R U
(86) За вка PCT:
EP 2004/007744 (13.07.2004)
C 2
C 2
(85) Дата перевода за вки PCT на национальную фазу:
21.02.2006
(87) Публикаци PCT:
WO 2005/013491 (10.02.2005)
Адрес дл переписки:
129090, Москва, ул. Б. Спасска , 25, стр.3,
ООО "Юридическа фирма Городисский и
Партнеры", пат.пов. Ю.Д.Кузнецову, рег.№ 595
(54) ПРЕОБРАЗОВАНИЕ ФОРМАТА АУДИОФАЙЛА
(57) Реферат:
Изобретение относитс к кодированию
аудиосигналов потоками аудиоданных. Сущность
изобретени состоит в объединении отдельных
потоков аудиоданных в многоканальные потоки
аудиоданных посредством модифицировани блока данных в потоке аудиоданных, деленном на
блоки данных с аудиоданными блока определени и
блока
данных,
например,
посредством
дополнени , прибавлени или замены их части, так
что они включают в себ индикатор длины,
показывающий величину или длину данных,
соответственно, аудиоданных блока данных или
величину или длину данных, соответственно, блока
данных, чтобы получить второй поток аудиоданных
с
модифицированными
блоками
данных.
Альтернативно, поток аудиоданных с указател ми
в блоках определени , указывающими на
аудиоданные блока определени , св занные с
этими блоками определени , но распределенные
среди различных блоков данных, преобразуетс в
поток аудиоданных, в котором аудиоданные блока
определени объедин ютс в аудиоданные
непрерывного
блока
определени .
Затем
аудиоданные непрерывного блока определени могут быть включены в самодостаточный элемент
канала вместе с их блоком определени .
Технический результат - упрощение манипул ции
аудиоданными
в
отношении
объединени отдельных потоков аудиоданных в многоканальные
потоки аудиоданных или общей манипул ции
потоком аудиоданных. 8 н. и 5 з.п. ф-лы, 9 ил.
Страница: 1
RU
2 3 3 5 0 2 2
(73) Патентообладатель(и):
ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ
ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)
(45) Опубликовано: 27.09.2008 Бюл. № 27
R U
(72) Автор(ы):
ГЕИЭРСБЕРГЕР Штефан (DE),
ГЕРНХАРДТ Харальд (DE),
ГРИЛЛ Бернхард (DE),
ХЕРТЛЬ Михель (DE),
ХИЛЬПЕРТ Йоханн (DE),
ЛУТЦКИ Манфред (DE),
ВАЙСХАРТ Мартин (DE),
ПОПП Харальд (DE)
C 2
C 2
2 3 3 5 0 2 2
2 3 3 5 0 2 2
R U
R U
Страница: 2
RUSSIAN FEDERATION
RU
(19)
(11)
2 335 022
(13)
C2
(51) Int. Cl.
G10L 19/14 (2006.01)
G11B 20/12 (2006.01)
FEDERAL SERVICE
FOR INTELLECTUAL PROPERTY,
PATENTS AND TRADEMARKS
(12)
ABSTRACT OF INVENTION
(21), (22) Application: 2006105203/09, 13.07.2004
(24) Effective date for property rights: 13.07.2004
(30) Priority:
21.07.2003 DE 10333071.2
27.08.2003 DE 10339498.2
(43) Application published: 27.06.2006
R U
(72) Inventor(s):
GEIEhRSBERGER Shtefan (DE),
GERNKhARDT Kharal'd (DE),
GRILL Bernkhard (DE),
KhERTL' Mikhel' (DE),
KhIL'PERT Jokhann (DE),
LUTTsKI Manfred (DE),
VAJSKhART Martin (DE),
POPP Kharal'd (DE)
(45) Date of publication: 27.09.2008 Bull. 27
(86) PCT application:
EP 2004/007744 (13.07.2004)
Mail address:
129090, Moskva, ul. B. Spasskaja, 25, str.3,
OOO "Juridicheskaja firma Gorodisskij i
Partnery", pat.pov. Ju.D.Kuznetsovu, reg.№ 595
C 2
C 2
(87) PCT publication:
WO 2005/013491 (10.02.2005)
R U
2 3 3 5 0 2 2
(54) TRANSFORMATION OF AUDIO FILE FORMAT
(57) Abstract:
FIELD: physics.
SUBSTANCE: invention is related to coding
audio signals with flows of audio data. Invention
consists in combination of separate flows of
audio data into multi-channel flows of audio data
by means of data unit modification in audio data
flow, which is divided into data units with audio
data of determination unit and data unit, for
instance, by supplementing, adding or replacing
of their part, so that they include indicator of
length, which displays value or length of data,
respectively, of audio data of data unit or value
or length of data, respectively, of data unit, in
order to receive the second flow of audio data
with modified data units. Alternatively, flow of
audio data with indicators in determination
units, which point to audio data of determination
unit connected to these units of determination,
but distributed among different data units, is
transformed into flow of audio data, in which
audio data of determination unit are combined
into audio data of continuous determination unit.
Then audio data of continuous determination unit
may be included into self-sufficient element of
channel together with their determination unit.
EFFECT:
simplification
of
audio
data
manipulation
in
relation
to
combination
of
separate flows of audio data into multi-channel
flows of audio data or general manipulation of
audio data flow.
13 cl, 9 dwg
Страница: 3
EN
2 3 3 5 0 2 2
(73) Proprietor(s):
FRAUNKhOFER-GEZELL'ShAFT TsUR
FERDERUNG DER ANGEVANDTEN FORShUNG
E.F. (DE)
(85) Commencement of national phase: 21.02.2006
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
Насто щее изобретение относитс к кодированию аудиосигналов потоками
аудиоданных, более конкретно к лучшей манипул ции потоками аудиоданных в формате
файла, в котором аудиоданные, св занные c меткой времени, могут распредел тьс по
различным блокам данных, как в случае формата MP3 (формат преобразовани аудиоданных).
Сжатие аудиоданных по стандарту MPEG вл етс особенно эффективным методом
сохранени аудиосигналов, таких как музыка или звук дл фильма, в цифровой форме, при
этом требующих, с одной стороны, как можно меньшей области пам ти и, с другой
стороны, поддержани как можно лучшего качества аудиосигналов. В последние несколько
лет сжатие аудиоданных по стандарту MPEG показало себ одним из самых успешных
решений в указанной области.
Между тем, существуют различные версии способов сжати аудиоданных по стандарту
MPEG. Аудиосигнал, вообще говор , дискретизируетс с некоторой частотой
дискретизации, причем результирующа последовательность выборок аудиоданных
св зана с перекрывающимис периодами времени или метками времени, соответственно.
Затем упом нутые метки времени подаютс отдельно, например, в банк гибридного
фильтра, состо щий из многофазного и модифицированного дискретного косинусного
преобразовани (MDCT), подавл ющего эффекты наложени спектров. Сжатие реальных
данных происходит во врем квантовани MDCT-коэффициентов. Затем MDCTкоэффициенты, квантованные таким способом, преобразуютс в код Хаффмана или
кодовые слова Хаффмана, генериру дополнительное сжатие посредством св зывани более коротких слов с более часто встречающимис коэффициентами. Таким образом, в
целом, сжатие по стандарту MPEG происходит с потер ми, однако, слышимые потери
ограничены, поскольку знание психоакустики включаетс за счет способа квантовани коэффициентов ДКП (дискретного косинусного преобразовани ).
Широко используемый стандарт MPEG представл ет собой так называемый стандарт
MP3, описанный в ISO/IEC 11172-3 и 13818-3. Указанный стандарт обеспечивает
возможность адаптации потерь информации, генерированных сжатием, к скорости
передачи в битах, с которой аудиоинформаци должна передаватьс в реальном масштабе
времени. Передача сигнала сжатых данных в канале с посто нной скоростью передачи в
битах также должна выполн тьс в других стандартах MPEG. Чтобы гарантировать, что
качество прослушивани в приемном декодере остаетс достаточным даже при низких
скорост х передачи в битах, стандарт MP3 предусматривает MP3-кодер, имеющий так
называемый битовый резервуар. Это означает следующее. Обычно, вследствие
фиксированной скорости передачи в битах, MP3-кодер должен кодировать каждую метку
времени в блок кодовых слов, имеющий одинаковый размер, причем указанный блок мог
бы передаватьс с заданной скоростью передачи в битах в периоде времени частоты
повторени периода времени. Однако последнее не подходит дл случа , когда некоторые
части аудиосигнала, такие как, например, звуки, следующие за очень громким звуком в
музыкальном произведении, требуют менее точного квантовани с посто нным качеством
по сравнению с другими част ми аудиосигнала, такими как, например, части со
множеством различных инструментов. Таким образом, MP3-кодер не генерирует простой
формат битового потока, где кажда метка времени кодируетс в одном кадре с
одинаковой длиной кадра дл всех потоков. Такой самодостаточный кадр мог бы состо ть
из заголовка кадра, дополнительной информации и основных данных, св занных с меткой
времени, св занной с кадром, а именно закодированными MDCT-коэффициентами, причем
дополнительна информаци представл ет собой информацию дл декодера, как должны
декодироватьс DCT-коэффициенты, например, сколько последующих DCTкоэффициентов равны 0, дл индикации того, какие DCT-коэффициенты последовательно
включаютс в основные данные. Однако обратный указатель включаетс в
дополнительную информацию или в заголовок, указыва на положение в основных данных
в одном из предыдущих кадров. Это положение вл етс началом основных данных,
относ щихс к метке времени, с которой св зан кадр, в который включен соответствующий
Страница: 4
DE
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
обратный указатель. Обратный указатель указывает, например, число битов, на которое
смещаетс начало основных данных в битовом потоке. Конец этих основных данных может
быть в любом кадре в зависимости от того, насколько высокой вл етс скорость сжати дл этой метки времени. Таким образом, длина основных данных отдельных меток
времени больше не вл етс посто нной. Таким образом, число битов, которым кодируетс блок, может адаптироватьс к свойствам сигнала. В то же самое врем может быть
достигнута посто нна скорость передачи в битах. Указанный метод называетс "битовым
резервуаром". Вообще говор , битовый резервуар вл етс буфером битов, который может
использоватьс , чтобы обеспечить больше битов дл кодировани блока временных
выборок, чем обычно допускаетс посто нной скоростью передачи выходных данных.
Метод битового резервуара учитывает тот факт, что некоторые блоки аудиовыборок могут
кодироватьс с меньшим количеством битов, чем это определ етс посто нной скоростью
передачи, так что упом нутые блоки заполн ют битовый резервуар, при этом другие блоки
аудиовыборок имеют свойства психоакустики, которые не допускают такое высокое сжатие,
так что доступных битов может действительно оказатьс недостаточно дл декодировани таких блоков с низкими помехами или без помех, соответственно. Требуемые избыточные
биты берутс из битового резервуара, так что битовый резервуар опустошаетс в течение
упом нутых блоков. Метод битового резервуара также описан в вышеуказанном сетевом
уровне 3 стандарта MPEG.
Хот формат MP3 не имеет преимуществ на стороне кодера, обеспечива обратные
указатели, на стороне декодера имеютс несомненные недостатки. Если, например,
декодер принимает битовый MP3-поток не сначала, а начина с некоторого кадра в
середине, то закодированный аудиосигнал на метке времени, св занной с указанным
кадром, может воспроизводитьс только сразу после того, как обратный указатель
случайно становитс равным 0, что должно указывать на то, что начало основных данных
дл данного кадра случайно имеет место сразу после заголовка или дополнительной
информации, соответственно. Однако обычно так не бывает. Таким образом,
воспроизведение аудиосигнала на этой метке времени невозможно, когда обратный
указатель кадра, который был прин т первым, указывает на предыдущий кадр, который,
однако, еще не был прин т. В указанном случае (сначала) может воспроизводитьс только
следующий кадр.
Далее, проблемы возникают на стороне приемника, в основном при обращении с
кадрами, которые взаимосв заны обратными указател ми и которые, таким образом, не
вл ютс самодостаточными. Кроме того, проблема битовых потоков с адресами возврата
дл битового резервуара состоит в том, что, когда различные каналы аудиосигнала
индивидуально кодируютс в формате MP3, основные данные, имеющие отношение друг к
другу в двух битовых потоках, поскольку они св заны с одной и той же меткой времени,
могли бы смещатьс друг к другу, с варьируемым смещением по последовательности
кадров так, чтобы снова преп тствовать объединению здесь указанных отдельных потоков
стандарта MP3 в многоканальный поток аудиоданных.
Дополнительно имеетс потребность в простой возможности генерации
легкоуправл емых, совместимых с форматом MP3 многоканальных потоков аудиоданных.
Многоканальные потоки аудиоданных MP3 согласно стандарту ISO/IEC 13818-3 требуют
матричных операций дл извлечени входных каналов из переданных каналов на стороне
декодера и дл использовани различных обратных указателей и, таким образом,
станов тс сложными дл управлени .
Потоки аудиоданных уровн 2 стандартов MPEG 1/2 соответствуют потокам
аудиоданных стандарта MP3 в составе последующих кадров и в структуре и расположении
кадров, а именно структуре заголовка, части дополнительной информации и основных
данных, и в расположении с квазистатической длиной кадров в зависимости от частоты
дискретизации и скорости передачи в битах, варьируемой от кадра к кадру, однако, они
отличаютс от них отсутствием обратных указателей или битового резервуара,
соответственно, во врем кодировани . Содержащие и не содержащие кодирование
Страница: 5
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
периоды времени аудиосигнала кодируютс с одинаковой длиной кадра. Основные данные,
относ щиес к метке времени, наход тс в соответствующем кадре вместе с
соответствующим заголовком.
Задача насто щего изобретени заключаетс в создании схемы дл преобразовани потока аудиоданных в дополнительный поток аудиоданных или наоборот, так что
манипул ци с аудиоданными осуществл етс проще, например, что касаетс объединени отдельных потоков аудиоданных в многоканальные потоки аудиоданных, или
манипул ци потоком аудиоданных в принципе.
Указанна задача достигаетс посредством способа по пп.1, 10, 13, 14 или 15 и
устройства по пп.16, 18, 19, 20 или 21.
Манипул ци аудиоданными может быть упрощена, как, например, в отношении
объединени отдельных потоков аудиоданных в многоканальные потоки аудиоданных или
общей манипул цией потоком аудиоданных, посредством модификации блока данных в
потоке аудиоданных, деленном на блоки данных с блоком определени и данными блока
данных, например, посредством дополнени , прибавлени или замены их части так, что
они включают в себ индикатор длины, показывающий величину или длину данных,
соответственно, аудиоданных блока данных или величину или длину данных,
соответственно, блока данных, чтобы получить второй поток аудиоданных с
модифицированными блоками данных. Альтернативно, поток аудиоданных с указател ми в
блоках определени , которые указывают на аудиоданные блока определени , св занные с
этими блоками определени , но распределенные среди различных блоков данных,
преобразуетс в поток аудиоданных, в котором аудиоданные блока определени объедин ютс в аудиоданные непрерывного блока определени . Затем аудиоданные
непрерывного блока определени могут быть включены в самодостаточный элемент
канала вместе с их блоком определени .
Насто щее изобретение основано на том, что основанным на указател х потоком
аудиоданных, где указатель указывает на начало аудиоданных блока определени соответствующего блока данных, легче управл ть, когда этим потоком аудиоданных
манипулируют так, что все аудиоданные блока определени , то есть аудиоданные,
касающиес одной и той же метки времени или кодировани аудиозначений дл одной и
той же аудиометки, объедин ютс в непрерывный блок аудиоданных непрерывного блока
определени , и соответствующий блок определени , с которым св заны аудиоданные
непрерывного блока определени , прибавл етс к нему. После их компоновки и
выравнивани , соответственно, элементы канала, полученные таким способом, привод т к
новому потоку аудиоданных, в котором все аудиоданные, относ щиес к одной метке
времени или кодированию аудиозначений или выборок, соответственно, дл данной метки
времени, также объедин ютс в один элемент канала, так что новым потоком аудиоданных
легче управл ть.
Согласно варианту осуществлени насто щего изобретени каждый блок определени или каждый элемент канала модифицируетс в новом потоке аудиоданных, например,
путем прибавлени или замены части, чтобы получить индикацию длины, показывающую
длину или величину данных, соответственно, элемента канала непрерывных аудиоданных,
включенных в него, чтобы упростить декодирование нового потока аудиоданных с
элементами канала варьируемой длины. Преимущественно, модификаци выполн етс путем замены избыточной части блоков определени , идентичных дл всех блоков
определени входного потока аудиоданных на соответствующую индикацию длины.
Указанна мера может обеспечить то, что скорость передачи данных в битах
результирующего потока аудиоданных становитс равной скорости передачи исходного
потока аудиоданных, несмотр на дополнительную индикацию длины по сравнению с
исходным, основанным на указател х, потоком аудиоданных, и что, тем самым, далее
может быть получен действительно излишний обратный указатель в новом потоке
аудиоданных, чтобы обеспечить возможность воссоздани исходного потока аудиоданных
из нового потока аудиоданных.
Страница: 6
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
Идентична избыточна часть указанных блоков определени может быть помещена
перед новым результирующим потоком аудиоданных в полном блоке определени . На
стороне приемника результирующий второй поток аудиоданных может быть, таким
образом, реконвертирован в исходный поток аудиоданных, чтобы использовать
существующие декодеры, которые могут только декодировать потоки аудиоданных
исходного формата файла дл декодировани результирующего потока аудиоданных в
формате без указател .
Согласно другому варианту осуществлени насто щего изобретени преобразование
первого потока аудиоданных во второй поток аудиоданных другого формата файла
используетс дл формировани многоканального потока аудиоданных из нескольких
потоков аудиоданных первого формата файла. Управл емость на стороне приемника
улучшаетс по сравнению с простой комбинацией исходных потоков аудиоданных с
указателем, поскольку в многоканальном потоке аудиоданных все элементы канала,
относ щиес к некоторой метке времени или содержащие аудиоданные непрерывного
блока определени , соответственно, были получены посредством кодировани одновременного периода времени канала многоканального аудиосигнала, то есть
посредством кодировани периодов времени различных каналов, относ щихс к метке
времени, которые могут быть объединены в блоки доступа. Указанна процедура
невозможна с основанными на указател х форматами аудиоданных, поскольку
аудиоданные дл одной метки времени могут быть распределены среди различных блоков
данных. Обеспечение блоков данных в различных потоках аудиоданных дл различных
каналов с индикацией длины позвол ет лучше выполн ть синтаксический анализ
посредством блоков доступа во врем объединени потоков аудиоданных в
многоканальный поток аудиоданных с блоками доступа.
Далее, насто щее изобретение вытекает из решени , состо щего в том, что очень легко
реконвертировать вышеописанные результирующие потоки аудиоданных в исходный
формат файла, который затем может декодироватьс в аудиосигнал существующими
декодерами. Хот результирующие элементы канала имеют различную длину и, таким
образом, несколько длиннее или несколько короче, чем длина, доступна в блоке данных
исходного потока аудиоданных, не требуетс смещать или объедин ть основные данные в
соответствии, в конечном счете, с дополнительно полученными обратными указател ми
дл воспроизведени потока аудиоданных в новом формате файла, а достаточно
увеличить индикацию скорости передачи в битах в блоках определени потока
аудиоданных дл генерировани исходного формата файла. Эффект заключаетс в том,
что, согласно такой индикации скорости передачи в битах, даже самый длинный из
элементов канала в потоке аудиоданных, который должен декодироватьс , имеет меньшую
или такую же длину, что и длина блока данных, которую блоки данных имеют в потоке
аудиоданных первого формата файла. Обратные указатели устанавливаютс равными
нулю, и элементы канала увеличиваютс до длины, соответствующей увеличенной
индикации скорости передачи в битах посредством добавлени битов значений
безразличных состо ний. Таким образом, генерируютс блоки данных потока аудиоданных
исходного формата файла, в котором соответствующие основные данные просто
включаютс в сам блок данных и не включаютс в любой другой. Поток аудиоданных
первого формата файла, реконвертированный таким образом, затем может подаватьс в
существующий декодер дл потоков аудиоданных первого формата файла, посредством
использовани скорости передачи в битах, увеличенной согласно увеличенной индикации
битов. Таким образом, дорогосто щие операции сдвига дл реконвертировани опускаютс , а также требование замены существующих декодеров на новые.
С другой стороны, согласно другому варианту осуществлени можно восстановить
исходный поток аудиоданных из результирующего потока аудиоданных, использу информацию, включенную в полный блок определени результирующего потока
аудиоданных по идентичной избыточной части блоков определени , чтобы восстановить
часть, перезаписанную посредством индикации длины.
Страница: 7
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
Краткое описание чертежей
В дальнейшем изобретение по сн етс описанием конкретных вариантов его
осуществлени со ссылками на чертежи, на которых:
фиг.1 - схематический чертеж дл иллюстрации формата MP3 файла с обратным
указателем,
фиг.2 - блок-схема дл иллюстрации структуры преобразовани MP3-потока
аудиоданных в MPEG-4-поток аудиоданных,
фиг.3 - схема последовательности операций способа преобразовани MP3-потока
аудиоданных в MPEG-4-поток аудиоданных согласно одному варианту осуществлени насто щего изобретени ,
фиг.4 - схематический чертеж дл иллюстрации этапа объединени ассоциированных
аудиоданных путем прибавлени блоков определени и этап модификации блоков
определени в способе по фиг.3,
фиг.5 - схематический чертеж дл иллюстрации способа преобразовани нескольких
MP3-потоков аудиоданных в многоканальный MPEG-4-поток аудиоданных согласно другому
варианту осуществлени насто щего изобретени ,
фиг.6 - блок-схема компоновки дл преобразовани MPEG-4-потока аудиоданных,
полученного согласно фиг.3, обратно в MP3-поток аудиоданных, дл обеспечени возможности декодировани его существующими декодерами,
фиг.7 - схема последовательности операций способа реконвертировани MPEG-4-потока
аудиоданных, полученного согласно фиг.3, в несколько потоков аудиоданных в формате
MP3,
фиг.8 - схема последовательности операций способа реконвертировани MPEG-4-потока
аудиоданных, полученного согласно фиг.3, в один или несколько потоков аудиоданных в
формате MP3, согласно другому варианту осуществлени насто щего изобретени , и
фиг.9 - схема последовательности операций способа преобразовани MP3-потока
аудиоданных в MPEG-4-поток аудиоданных согласно другому варианту осуществлени насто щего изобретени .
Насто щее изобретение по сн етс со ссылками на чертежи, иллюстрирующие
варианты его осуществлени , в которых исходный поток аудиоданных в формате файла, в
котором в блоках определени блоков данных используютс обратные указатели дл указани на начало основных данных, относ щихс к блоку определени , вл етс просто
иллюстративным MP3-потоком аудиоданных, тогда как результирующий поток
аудиоданных, состо щий из самодостаточных элементов канала, в котором объедин ютс аудиоданные, относ щиес к соответствующей метке времени, также вл етс просто
иллюстративным MPEG-4-потоком аудиоданных. Формат MP3 описываетс в стандарте
ISO/IEC 11172-3 и 13818-3, цитируемом в уровне техники, тогда как формат MPEG-4-файла
описываетс в стандарте ISO/IEC 14496-3.
Сначала со ссылкой на фиг.1 описан формат MP3. Фиг.1 показывает часть MP3-потока
10 аудиоданных. Поток 10 аудиоданных состоит из последовательности кадров или блоков
данных, соответственно, из которых только три показаны на фиг.1, а именно 10a, 10b и
10c. MP3-поток 10 аудиоданных генерирован MP3-кодером из аудиосигнала или
аудиосигнала, соответственно. Аудиосигнал, кодированный потоком 10 данных,
представл ет собой, например, музыку, шум, их смесь и т.п. Каждый из блоков 10a, 10b
и 10c данных св зан с одним из последовательных, возможно, перекрывающихс периодов
времени, на которые аудиосигнал был разделен MP3-кодером. Каждый период времени
соответствует метке времени аудиосигнала и, таким образом, в описании термин «метка
времени» часто используетс дл периода времени. Каждый период времени закодирован
в основные данные (main_data) MP3-кодером отдельно, например, посредством гибридного
банка фильтров, состо щего из многофазного банка фильтров и модифицированного
дискретного косинусного преобразовани с последующей энтропией, как, например,
кодирование методом Хаффмана. Основные данные, относ щиес к последовательным
трем меткам времени, с которыми св заны блоки 10a-10c данных, иллюстрируютс на
Страница: 8
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
фиг.1 ссылочными позици ми в виде непрерывных блоков вместо действительного потока
10 аудиоданных.
Блоки 10a-10c данных потока 10 аудиоданных упор дочены эквидистантно в потоке 10
аудиоданных. Это означает, что каждый блок 10a-10c данных имеет одинаковую длину
блока данных или длину кадра, соответственно. Снова длина кадра зависит от скорости
передачи в битах, с которой поток 10 аудиоданных должен, по меньшей мере,
воспроизводитьс в реальном масштабе времени с частотой дискретизации, которую MP3кодер использовал дл дискретизации аудиосигнала до действительного кодировани .
Св зь заключаетс в том, что частота дискретизации показывает, насколько длинной
вл етс метка времени в св зи с фиксированным числом выборок на метку времени, и в
том, что из скорости передачи в битах и периода времени метки можно вычислить,
сколько битов может передаватьс в этом периоде времени.
Оба параметра, то есть скорость передачи в битах и частота дискретизации, указаны в
заголовках 14 кадров в блоках 10a-10c данных. Таким образом, каждый блок 10a-10c
данных имеет свой собственный заголовок 14 кадра. Вообще говор , вс информаци ,
важна дл декодировани потока аудиоданных, сохран етс в каждом кадре 10a-10c сама
по себе, так что декодер может начинать декодирование в середине МР3-потока 10
аудиоданных.
Отдельно от заголовка 14 кадра, который находитс в начале, каждый блок 10a-10c
данных имеет участок 16 дополнительной информации и участок 18 основных данных,
содержащий аудиоданные блока данных. Участок 16 дополнительной информации следует
непосредственно после заголовка 14. Она включает в себ информацию, существенную
дл декодера потока 10 аудиоданных дл нахождени аудиоданных основных данных или
блока определени , соответственно, св занных с соответствующим блоком данных,
которые просто представл ют собой кодовые слова Хаффмана, расположенные линейно
последовательно, дл декодировани их правильным способом в DCT- или MDCTкоэффициенты, соответственно. Участок 18 основных данных составл ет конец каждого
блока данных.
Как упоминалось в разделе описани уровн техники, стандарт MP3 реализует функцию
резервуара. Это обеспечиваетс обратными указател ми, включенными в дополнительную
информацию в пределах участка 16 дополнительной информации, обозначенной на фиг.1
ссылочной позицией 20. Если обратный указатель устанавливаетс на 0, то основные
данные дл этой дополнительной информации начинаютс непосредственно после участка
16 дополнительной информации. В противном случае обратный указатель 20
(main_data_begin) показывает начало основных данных, кодирующих метку времени, с
которой св зан блок данных, причем дополнительна информаци 16, содержаща обратный указатель 20, включаетс в предыдущий блок данных. Например, на фиг.1 блок
10a данных св зан c меткой времени, кодированной основными данными 12a. Обратный
указатель 20 в дополнительной информации 16 этого блока 10a данных указывает,
например, на начало основных данных 12a, которые наход тс в блоке данных перед
блоком 10a данных в направлении 22 потока посредством указани смещени бита или
байта, измеренного от начала заголовка 14 блока 16a данных. Последнее означает, что в
это врем , во врем кодировани аудиосигнала, битовый резервуар MP3-кодера,
генерирующего MP3-поток 10 аудиоданных, не был заполнен, но мог быть загружен до
высоты обратного указател . Из положени , на которое указывает обратный указатель 20
блока 10a данных, вперед основные данные 12a вставл ютс в поток 10 аудиоданных с
эквидистантно расположенными парами заголовков и дополнительной информации 14, 16.
В насто щем примере основные данные 12a распростран ютс чуть больше, чем на
половину участка 18 основных данных блока 10a данных. Обратный указатель 20 на
участке 16 дополнительной информации последующего блока 10b данных указывает на
положение непосредственно после основных данных 12a в блоке 10a данных. То же самое
применимо к обратному указателю 20 в дополнительной информации 16 блока 10c данных.
Как можно видеть, указанна ситуаци - скорее, исключение в MP3-потоке 10
Страница: 9
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
аудиоданных, когда основные данные, относ щиес к метке времени, действительно
исключительны в блоке данных, св занном с меткой времени. Обычно блоки данных
большей частью распределены по одному или нескольким блокам данных, которые могли
бы даже не включать соответствующий блок данных сам по себе, в зависимости от размера
битового резервуара.
После структуры MP3-потока аудиоданных, описанной со ссылкой на фиг.1, описана
компоновка со ссылкой на фиг.2, котора подходит дл преобразовани MP3-потока
аудиоданных в MPEG-4-поток аудиоданных, или дл получени MPEG-4-потока
аудиоданных из аудиосигнала, который может быть легко преобразован в формат MP3.
Фиг.2 изображает MP3-кодер 30 и MP3-MPEG-4-преобразователь 32. MP3-кодер 30
содержит вход дл приема аудиосигнала, который должен кодироватьс , и выход дл вывода MP3-потока аудиоданных, кодирующего аудиосигнал на входе. MP3-кодер 30
действует согласно вышеупом нутому стандарту MP3.
MP3-поток аудиоданных, структура которого описана со ссылкой на фиг.1, состоит, как
упоминалось, из кадров с фиксированной длиной кадра, котора зависит от установленной
скорости передачи в битах и основной частоты дискретизации, а также от байта
заполнени , который устанавливаетс или не устанавливаетс . MP3-MPEG-4преобразователь 32 принимает MP3-поток аудиоданных на входе и выводит MPEG-4-поток
аудиоданных на выходе, структура которого пон тна из последующего описани режима
работы MP3-MPEG-4-преобразовател 32. Преобразователь 32 обеспечивает
преобразование MP3-потока аудиоданных из формата MP3 в формат MPEG-4. Формат
MPEG-4 данных имеет то преимущество, что все основные данные, относ щиес к
некоторой метке времени, включаютс в непрерывный блок доступа или элемент канала,
так что манипул ци последним значительно облегчаетс .
Фиг.3 показывает отдельные этапы способа во врем преобразовани МР3-потока
аудиоданных в MPEG-4-поток аудиоданных, выполн емое преобразователем 32. Сначала
на этапе 40 принимаетс MP3-поток аудиоданных. Прием может содержать сохранение
полного потока аудиоданных или просто текущей части потока в регистре-защелке.
Соответственно, последующие этапы в процессе преобразовани могут выполн тьс либо
во врем приема 40 в реальном масштабе времени, либо только вслед за ним.
Затем, на этапе 42, все аудиоданные или основные данные, соответственно,
относ щиес к метке времени, объедин ютс в непрерывный блок, причем это выполн тс дл всех меток времени. Этап 42 более подробно иллюстрируетс на фиг.4, где элементы
MP3-потока аудиоданных, подобные элементам, иллюстрируемым на фиг.1, обозначены
такими же или подобными ссылочными позици ми, и повторное описание указанных
элементов опускаетс .
Как можно видеть из направлени 22 потока данных, указанные части MP3-потока 10
аудиоданных, иллюстрируемых ближе к левой части фиг.4, достигают преобразовател 32
раньше, чем его правые части. Блоки 10a и 10b данных полностью иллюстрируютс на
фиг.4. Метка времени, относ ща с к блоку 10a данных, кодируетс основными данными
MD1, включенными в фиг.4, иллюстративно частично в блоке данных перед блоком 10
данных и частично в блоке 10a данных, и здесь, в частности, на участке 18 основных
данных. Те основные данные, кодирующие метку времени, с которыми св зан
последующий блок 10b данных, включаютс исключительно в участок 18 основных данных
блока 10a данных и обозначены как MD2. Основные данные, относ щиес к блоку данных,
следующему за блоком 10b данных, распредел ютс среди участков 18 основных данных
блоков 10a и 10b данных.
На этапе 42 преобразователь 42 объедин ет все основные данные, кодирующие одну и
ту же метку времени, в непрерывные блоки. Таким образом, участок 44 перед блоком 10a
данных участка 46 в блоке 10a данных в основных данных MD1 приводит к получению
непрерывного блока 48 путем объединени после этапа 42. То же самое выполн етс дл других основных данных MD2, MD3.
Дл выполнени этапа 42 преобразователь 32 считывает указатель в дополнительной
Страница: 10
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
информации 16 блока данных, и затем, на основе этого указател , считывает
соответствующую первую часть 44 аудиоданных 12a блока определени дл этого блока
10a данных, включенного в поле 18 предыдущего блока данных, начина с положени ,
определенного указателем, вплоть до заголовка текущего блока 10a данных. Затем он
считывает вторую часть 46 аудиоданных, включенную в часть 18 текущего блока 10a
данных, и содержащую конец аудиоданных блока определени дл этого блока 10a
данных, начина от конца дополнительной информации 16 текущего блока 10a данных до
начала следующих аудиоданных MD2, до следующего блока 10b данных, на который
указывает указатель в дополнительной информации 16 последующего блока 10b данных,
который также считывает преобразователь 32. Объединение двух частей, как уже
описывалось, приводит к получению блока 48.
На этапе 50 преобразователь 32 прибавл ет ассоциированный заголовок 14,
включающий в себ ассоциированную дополнительную информацию 16, к непрерывным
блокам, чтобы окончательно сформировать МР3-элементы 52a, 52b и 52c канала. Таким
образом, каждый из элементов 52a-52c канала состоит из заголовка 14 соответствующего
MP3-блока данных, последующего участка 16 дополнительной информации того же MP3блока данных, и непрерывного блока 48 основных данных, кодирующих метку времени, с
которой св зан блок данных, из которого исходит заголовок и дополнительна информаци .
МР3-элементы канала, получающиес в результате этапов 42 и 50, имеют различные
длины элементов канала, как показано двойными стрелками 54a-54c. Следует отметить,
что блоки 10a, 10b данных в МР3-потоке 10 аудиоданных имеют фиксированную длину 56
кадра, но число основных данных дл отдельных меток времени измен етс относительно
среднего значени благодар функции битового резервуара.
Дл облегчени декодировани и особенно синтаксического анализа отдельных МР3элементов 52a-52c канала на стороне декодера, заголовки 14 H1-H3 модифицируютс ,
чтобы получить длину соответствующего элемента канала 52a-52c, то есть 54a-54c.
Указанна операци выполн етс на этапе 56. Ввод длины записываетс в часть,
идентичную избыточной, соответственно, дл всех заголовков 14 потока 10 аудиоданных.
В формате MP3 каждый заголовок 14 вначале принимает некое фиксированное
синхронизирующее слово (синхрослово), состо щее из 12 битов. На этапе 56 указанное
синхрослово заполн етс длиной соответствующего элемента канала. 12 бит синхрослова
достаточны дл представлени длины соответствующего элемента канала в двоичной
форме, так что длина результирующих элементов 58a-58c канала с модифицированным
заголовком hl-h3 остаетс такой же, несмотр на этап 56, то есть равной 54a-54c.
Таким образом, аудиоинформаци может передаватьс с такой же скоростью передачи в
битах в реальном масштабе времени или воспроизводитьс в виде исходного MP3-потока
10 аудиоданных после объединени MP3-элементов 58a-58c канала согласно пор дку
метки времени, закодированной аналогично, несмотр на прибавление индикации длины,
никакие другие служебные данные не добавл ютс дополнительными заголовками.
На этапе 58 заголовок файла, или дл случа , когда генерируемый поток данных
вл етс не файлом, а потоковой передачей данных, заголовок потока данных
генерируетс дл желательного MPEG-4-потока аудиоданных (этап 60). Поскольку согласно
насто щему варианту осуществлени должен генерироватьс поток аудиоданных,
совместимый со стандартом MPEG-4, заголовок файла генерируетс в соответствии со
стандартом MPEG-4, в таком случае заголовок кадра имеет фиксированную структуру
благодар функции AudioSpecificConfig, котора задаетс в вышеупом нутом стандарте
MPEG-4. Интерфейс дл MPEG-4-системы обеспечиваетс элементом ObjectTypeIndication,
установленным со значением 0х40, а также индикацией AudioObjectType с числом 29.
Функци AudioSpecificConfig, задаваема стандартом MPEG-4, распростран етс на ее
исходное определение в стандарте ISO/IEC 14496-3, в котором следующий пример
рассматривает только содержание функции AudioSpecificConfig, имеющее з??ачение дл насто щего описани , а не все из них:
1
AudioSpecificConfig() {
2
audioObjectType;
Страница: 11
RU 2 335 022 C2
3
samplingFrequencyIndex;
4 if(samplingFrequencyIndex==0xf)
5
10
15
20
25
30
35
40
5
samplingFrequency;
6
channelComfiguration;
7
if(audioObjectType==29){
8
MPEG_1_2_SpecificConfig();
9
}
10
}
Вышеупом нутый список AudioSpecificConfig вл етс представлением общей системы
обозначений дл функции AudioSpecificConfig, котора служит дл синтаксического
анализа или считывани параметров вызова в заголовке файла в декодере, а именно
samplingFrequencyIndex, channelConfiguration и audioObjectType, или показывает
инструкции, как должен декодироватьс или анализироватьс заголовок файла.
Можно видеть, что заголовок файла, генерированный на этапе 60, начинаетс с
индикации элемента AudioObjectType, который устанавливаетс на число 29 (строка 2),
как упоминалось выше. Параметр audioObjectType показывает декодеру, каким способом
должны кодироватьс данные, и в частности, каким способом должна выдел тьс дополнительна информаци дл кодировани заголовка файла, как объ снено ниже.
Затем следует параметр вызова samplingFrequencyIndex, который указывает на
некоторое положение в нормированной таблице дл частот дискретизации (строка 3). Если
индекс равен 0 (строка 4), то индикаци частоты дискретизации следует без указани на
нормированную таблицу (строка 5).
Затем следует индикаци конфигурации канала (строка 6), котора показывает
способом, который подробно описан далее, сколько каналов включаетс в генерированный
MPEG-4-поток аудиоданных, в котором также возможно, в противоположность насто щему
варианту осуществлени , объедин ть более одного МР3-потока аудиоданных в MPEG-4поток аудиоданных, что также описано ниже со ссылкой на фиг.5.
Затем, если audioObjectType составл ет 29, как в данном случае, то следует часть
заголовка файла AudioSpecificConfig, содержащего избыточную часть заголовка MP3-кадра
в потоке 10 аудиоданных, то есть часть, остающа с такой же из заголовков 14 кадров
(строка 8). Указанна часть показана здесь обозначением MPEG_l_2_SpecificConfig(), то
есть снова функци , задающа структуру этой части.
Хот структура элемента MFEG_l_2_SpecificConfig также может быть вз та из стандарта
MP3, поскольку она соответствует фиксированной части заголовка MP3-кадра, который не
мен етс от кадра к кадру, его структура иллюстративно приводитс ниже:
1
MPEG_l_2_SpecificConfig(channelConfiguration){
2
syncword (синхрослово)
3
ID (идентификатор)
4
Layer (уровень)
5
Reserved (зарезервированный)
6
sampling_frequency (частота дискретизации)
7
reserved (зарезервированный)
8
reserved (зарезервированный)
9
reserved (зарезервированный)
10
if(channelConfiguration==0){
11 channel configuration description (описание конфигурации канала);
45
50
12
}
13
}
В части MPEG_l_2_SpecificConfig все биты, отличающиес от заголовка кадра до
заголовка 14 кадра в МР3-потоке аудиоданных, устанавливаютс на 0. В этом случае
первый параметр MPEG_l_2_SpecificConfig, а именно 12-битовое слово синхронизации синхрослово (syncword), служащее дл синхронизации MP3-кодера, при приеме МР3-потока
аудиоданных (строка 2), вл етс одним и тем же дл каждого заголовка кадра.
Последующий параметр ID (идентификатор) показывает MPEG-версию, то есть 1 или 2,
посредством соответствующего стандарта ISO/IEC 13818-3 дл версии 2 и стандарта
Страница: 12
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
ISO/IEC 11172-3 дл версии 1. Параметр уровень (строка 4) дает индикацию уровню 3,
который соответствует стандарту MP3. Следующий бит резервируетс (строка 5),
поскольку его значение может измен тьс от кадра к кадру, и передаетс элементами МР3канала. Упом нутый бит показывает веро тность того, что за заголовком следует
переменна CRC (циклический избыточный код). Следующа переменна sampling_frequency (частота дискретизации) (строка 6) указывает на таблицу с
частотами дискретизации, заданными в стандарте MP3, и таким образом, показывает
частоту дискретизации, лежащую в основе MP3-DCT-коэффициентов. Затем, в строке 7,
следует индикаци бита дл конкретных приложений (зарезервированных), а также в
строках 8 и 9. Затем (в строках 11, 12) следует точное определение конфигурации
канала, когда параметр, показанный в строке 6 AudioSpecificConfig, не указывает на
предварительно определенную конфигурацию канала, а имеет значение 0. В противном
случае примен етс конфигураци канала таблицы 1.11 14496-3 подраздела 1.
Этапом 60, и, в частности, посредством обеспечени элемента MPEG_l_2_SpecificConfig
в заголовке файла, который включает в себ всю избыточную информацию в заголовках 10
кадра исходного МР3-потока 10 аудиоданных, гарантируетс , что указанна часть в
заголовках кадра не приводит к невосполнимой потере этой информации в MPEG-4-файле,
который должен генерироватьс во врем вставки данных, облегчающих декодирование,
как, например, на этапе 56, посредством вставки длины элемента канала, но что
указанна модифицированна часть может быть восстановлена с использованием
заголовка MPEG-4-файла.
Затем, на этапе 62, MPEG-4-поток аудиоданных выводитс в пор дке заголовка MPEG-4файла, генерированного на этапе 60, и элементов канала, в пор дке св занных с ними
меток времени, при этом полный MPEG-4-поток аудиоданных приводит к получению MPEG4-файла или передаетс посредством MPEG-4-систем.
Вышеприведенное описание относитс к преобразованию МР3-потока аудиоданных в
MPEG-4-поток аудиоданных. Однако, как показано пунктирными лини ми на фиг.2, можно
преобразовывать два или более МР3-потока аудиоданных из двух MP3-кодеров, а именно
30 и 30', в многоканальный MPEG-4-поток аудиоданных. В таком случае MP3-MPEG-4преобразователь 32 принимает МР3-поток аудиоданных всех кодеров 30 и 30' и выводит
многоканальный поток аудиоданных в формате MPEG-4.
Фиг.5 в верхней половине иллюстрирует, дл представлени по фиг.4, каким образом
может быть получен многоканальный поток аудиоданных согласно стандарту MPEG-4,
причем преобразование снова выполн етс преобразователем 32. Иллюстрируетс три
последовательности 70, 72 и 74 элементов канала, которые генерировались согласно
этапам 40-56 из одного аудиосигнала, каждый кодером 30 или 30' (фиг.2). Из каждой
последовательности 70, 72 и 74 элементов канала показаны соответствующие элементы, а
именно 70a, 70b, 72a, 72b или 74a, 74b элементы канала, соответственно. На фиг.5
каждый из элементов канала, расположенных друг над другом, здесь 70a-74a или 70b-74b,
соответственно, св зан с одной и той же меткой времени. Например, элементы канала
последовательности 70 кодируют аудиосигнал, который был записан в соответствии с
подход щим нормированием спереди слева, справа (спереди), тогда как
последовательности 72 и 82 кодируют аудиосигналы, представл ющие запись того же
аудиоисточника с других направлений или с другим частотным спектром, как например,
центральный передний громкоговоритель (центр) и сзади справа и слева (объемное
звучание).
Как показано стрелками 76, указанные элементы канала теперь объедин ютс в блоки
во врем вывода (этап 62 на фиг.3) в MPEG-4-потоке аудиоданных, упоминаемые ниже как
блоки 78 доступа. Таким образом, в MPEG-4-потоке аудиоданных данные, наход щиес в
блоке 78 доступа, всегда св заны с меткой времени. Расположение МР3-элементов 70a,
72a и 74a канала в блоке 78 доступа, здесь в пор дке - передний канал, центральный
канал и канал объемного звучани , учитываетс в заголовке файла, как генерированное
дл MPEG-4-потока аудиоданных, который должен генерироватьс (этап 60 на фиг.3)
Страница: 13
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
посредством соответствующей компоновки конфигурации канала параметра вызова в
функции AudioSpecificConfig, причем ссылка оп ть делаетс на подраздел 1 в стандарте
XSO/IEC 14496-3. Блоки 78 доступа снова последовательно располагаютс в MPEG-4потоке согласно пор дку их меток времени, и им предшествует заголовок MPEG-4-файла.
Параметр channelConfiguration устанавливаетс соответственно в заголовке MPEG-4файла, чтобы показать пор док элементов канала в блоках доступа или их значимость на
стороне декодера, соответственно.
Как следует из вышеприведенного описани фиг.5, легко объединить МР3-потоки
аудиоданных в многоканальный поток аудиоданных, если, как предложено согласно
насто щему изобретению, МР3-потоками аудиоданных манипулируют, чтобы получить
самодостаточные элементы канала из блоков данных, причем все данные дл одной метки
времени включаютс в один элемент канала, причем эти элементы канала из отдельных
каналов могут быть легко объединены в блоки доступа.
Насто щее описание относитс к преобразованию одного или нескольких МР3-потоков
аудиоданных в MPEG-4-поток аудиоданных. Однако существенной идеей насто щего
изобретени вл етс то, что все преимущества результирующего MPEG-4-потока
аудиоданных, как то улучшенна управл емость отдельных самодостаточных МР3элементов канала с равной скоростью передачи и возможностью многоканальной
передачи, могут использоватьс без необходимости замен ть существующие MP3-кодеры
полностью на новые декодеры, и что реконверси может быть выполнена без проблем, так
что аналогичный подход можно использовать во врем декодировани вышеупом нутого
MPEG-4-потока аудиоданных.
На фиг.6 иллюстрируетс блок-схема, содержаща блок 100 восстановлени МР3,
режим работы которого более подробно описан ниже, и декодеры 102, 102'... Блок 100
восстановлени МР3 принимает на входе MPEG-4-поток аудиоданных, генерированный
согласно одному из предыдущих вариантов осуществлени , и выводит один или, в случае
многоканального потока аудиоданных, несколько МР3-потоков аудиоданных на один или
несколько декодеров 102, 102'..., которые непосредственно декодируют соответственно
прин тый МР3-поток аудиоданных в соответствующий аудиосигнал, и посылают его в
соответствующие громкоговорители, расположенные в соответствии с конфигурацией
канала.
Особенно простой путь восстановлени исходных МР3-потоков аудиоданных из MPEG-4потока аудиоданных, генерированного согласно фиг.5, описан ниже со ссылкой на фиг.5 и
фиг.7, в котором указанные этапы выполн ютс блоком восстановлени MP3 по фиг.6.
Сначала блок 100 восстановлени MP3 подтверждает на этапе 110, что MPEG-4-поток
аудиоданных, прин тый на входе, представл ет собой переформатированный МР3-поток
аудиоданных, посредством проверки параметра вызова audioObjectType в заголовке файла
согласно функции AudioSpecificConfig, включает ли указанный параметр значение 29.
Если это имеет место (строка 7 в AudioSpecificConfig), то блок 100 восстановлени MP3
приступает к синтаксическому анализу заголовка файла MPEG-4-потока аудиоданных, и
считывает избыточную часть всех заголовков кадра исходного МР3-потока аудиоданных из
части MPEG_l_2_SpecificConfig, из которой был получен MPEG-4-поток аудиоданных (этап
112).
После оценки MPEG_l_2_SpecificConfig, блок 100 восстановлени MP3 на этапе 114
замен ет в каждом элементе канала 74a-74c в соответствующем заголовке hF, hC, hS одну
или несколько частей элементов канала на компоненты MPEG_l_2_SpecificConfig, в
частности, индикацию длины элемента канала на слово синхронизации из
MPEG_l_2_SpecificConfig, чтобы снова получить заголовки кадра исходного МР3-потока
аудиоданных, HF, HC и HS, как показано стрелками 116. На этапе 118 блок 100
восстановлени MP3 модифицирует дополнительную информацию SF, SC и SS в MPEG-4потоке аудиоданных в каждом элементе канала. В частности, обратный указатель
устанавливаетс на 0, чтобы получить новую дополнительную информацию S'F, S'C и S'S.
Манипул ци согласно этапу 118 показана на фиг.5 стрелкой 120. Затем, на этапе 122,
Страница: 14
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
блок 100 восстановлени MP3 устанавливает индекс скорости передачи в битах в каждом
элементе канала 74a-74c в заголовке кадра HF, HC, HS, обеспеченном на этапе 114 словом
синхронизации вместо индикации длины элемента канала до наивысшего допустимого
значени . В итоге, результирующие заголовки отличаютс от исходных, что показано на
фиг.5 апострофом, то есть H'F, H'C и H'S. Манипул ци элементов канала согласно этапу
122 также показана стрелкой 120.
Дл иллюстрации изменений этапов 114-122, на фиг.5 привод тс отдельные параметры
дл заголовка H'F и части дополнительной информации S'F. Ссылочной позицией 124
обозначены отдельные параметры заголовка H'F. Заголовок кадра, H'F, начинаетс с
параметра синхрослова. Синхрослово устанавливаетс на исходное значение (этап 114),
как это имеет место в каждом МР3-потоке аудиоданных, а именно на значение 0xFFF.
Вообще говор , заголовок кадра, H'F, получающийс в результате этапов 114-122,
отличаетс от исходного заголовка MP3-кадра, включенного в исходный МР3-поток 10
аудиоданных только тем, что индекс скорости передачи в битах устанавливаетс на
наивысшее допустимое значение, которое согласно стандарту MP3 составл ет 0xE.
Цель изменени индекса скорости передачи в битах состоит в том, чтобы получить
новую длину кадра или длину блока данных, соответственно, дл нового подлежащего
генерации МР3-потока аудиоданных, котора больше, чем у одного из исходных МР3потоков аудиоданных, из которого генерирован MPEG-4-поток аудиоданных с блоком 78
доступа. Оригинальное решение здесь состоит в том, что длина кадра в байтах в формате
MP3 всегда зависит от скорости передачи в битах согласно следующему уравнению:
дл уровн 3 стандарта MPEG 1:
длина кадра [бит] = 1152 * скорость передачи в битах [бит/сек] / частота
дискретизации [бит/сек] + 8 * бит заполнени [бит]
дл уровн 3 стандарта MPEG 2:
длина кадра [бит] = 576 * скорость передачи в битах [бит/сек] / частота
дискретизации [бит/сек] + 8 * бит заполнени [бит].
Другими словами, длина кадра МР3-потока аудиоданных согласно стандарту
пр мопропорциональна скорости передачи в битах и обратнопропорциональна частоте
дискретизации. В качестве дополнительного значени прибавл етс значение битов
заполнени , которое показано в заголовках MP3-кадра hF, hC, hS и может использоватьс дл того, чтобы точно устанавливать скорость передачи в битах. Частота дискретизации
вл етс фиксированной, поскольку она определ ет, с какой скоростью воспроизводитс декодированный аудиосигнал. Преобразование скорости передачи в битах по сравнению с
исходной настройкой позвол ет подгон ть такие МР3-элементы 74-74c канала к длине
блока данных нового, подлежащего генерации МР3-потока аудиоданных, которые длиннее,
чем исходный, поскольку дл генерации исходного потока аудиоданных, основные данные
генерировались заимствованием битов из битового резервуара.
Таким образом, хот в насто щем варианте осуществлени индекс скорости передачи в
битах всегда устанавливаетс на наивысшее допустимое значение, можно было бы
дополнительно увеличить индекс скорости передачи в битах только до значени ,
достаточного дл получени длины блока данных согласно стандарту MP3, чтобы даже
самые длинные МР3-элементы канала 74a-74c могли бы подгон тьс с учетом их длины.
Ссылочной позицией 126 иллюстрируетс , что обратный указатель main_data_begin
устанавливаетс на 0 в результирующей дополнительной информации. Это означает
только то, что в МР3-потоке аудиоданных, генерированном согласно способу по фиг.7,
блоки данных всегда вл ютс самодостаточными, так что основные данные дл определенного заголовка кадра и дополнительной информации всегда начинаютс непосредственно после дополнительной информации и в пределах того же блока данных.
Этапы 114, 118, 122 выполн ютс на каждом элементе канала путем выделени каждого
элемента канала из их блоков доступа, причем индикации длины элементов канала могут
быть использованы при выделении.
Затем на этапе 128 то количество данных заполнени или битов безразличного
Страница: 15
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
состо ни прибавл етс к каждому элементу канала 74a-74c, чтобы увеличить длину всех
МР3-элементов канала единообразно до длины MP3-блока данных, установленной новым
индексом скорости передачи в битах, 0xE. Эти данные заполнени показаны ссылочной
позицией 128 на фиг.5. Количество данных заполнени может быть вычислено дл каждого
элемента канала, например, посредством оценки индикации длины элемента канала и бита
заполнени .
Затем на этапе 130 элементы канала, показанные на фиг.5 ссылочными позици ми 74a'74c', модифицированные согласно предыдущим этапам, посылаютс в соответствующий
MP3-декодер или в элемент 134a-134c декодера в виде блоков данных МР3-потока
аудиоданных в пор дке кодированных меток времени. Заголовок MPEG-4-файла
опускаетс . Результирующие МР3-потоки аудиоданных показаны на фиг.5 в целом
ссылочными позици ми 132a, 132b и 132c. Элементы 134a-134c MP3-декодера, например,
были инициализированы перед тем, как такое же число элементов канала включено в
отдельные блоки доступа.
В реконструирующем MP3-устройстве 100 из оценки параметра channelConfiguration
вызова в функции AudioSpecificConfig MPEG-4-потока аудиоданных, известно, какой из
элементов 74a-74c канала в блоке 78 доступа MPEG-4-потока аудиоданных принадлежит
какому из МР3-потоков аудиоданных, которые должны генерироватьс . Таким образом,
элемент 134a декодера, подключенный к переднему громкоговорителю, принимает поток
132a аудиоданных, соответствующий переднему каналу, и, соответственно, элементы 134b
и 134c декодера принимают потоки 132b и 132c аудиоданных, св занные с центральным
каналом и каналом объемного звучани , и вывод т результирующие аудиосигналы в
соответственно расположенные громкоговорители, например, в низкочастотный динамик,
или в громкоговорители, расположенные, например, сзади слева и сзади справа,
соответственно.
Конечно, дл кодировани MPEG-4-потока аудиоданных в реальном масштабе времени
с использованием конфигурации по фиг.6 с элементами 102, 102' или 134a-134c декодера
требуетс передавать заново генерированные МР3-потоки 132a-132c аудиоданных со
скоростью передачи в битах, увеличенной на этапе 122, котора выше, чем в исходном
потоке 10 аудиоданных, что, однако, не вл етс проблемой, поскольку схема между
блоком 100 восстановлени МР3 и MP3-декодерами 102, 102' или 134a-134c вл етс фиксированной, так что здесь каналы передачи соответственно короткие и могут
проектироватьс с соответственно высокой скоростью передачи в битах с более низкой
стоимостью и трудозатратами.
Согласно варианту осуществлени , описанному со ссылкой на фиг.7, многоканальный
MPEG-4-поток аудиоданных, полученный согласно фиг.5 из исходных потоков 10
аудиоданных, не был реконвертирован точно в исходные МР3-потоки аудиоданных, но
другие МР3-потоки аудиоданных были генерированы из него, причем в противоположность
исходным потокам аудиоданных все обратные указатели устанавливаютс на 0, а индекс
скорости передачи в битах устанавливаетс на наивысшее значение. Таким образом, блоки
данных этих заново генерированных МР3-потоков аудиоданных вл ютс самодостаточными, если все данные, св занные с определенной меткой времени,
включаютс в один и тот же блок данных, и дл увеличени длины блока данных до
единообразного значени использовались данные заполнени .
Фиг.8 показывает вариант осуществлени способа, согласно которому можно
реконвертировать MPEG-4-поток аудиоданных, генерированный согласно вариантам
осуществлени по фиг.1-5, в исходные МР3-аудиопотоки или исходный МР3-поток
аудиоданных, соответственно.
В данном случае блок 100 восстановлени MP3 на этапе 150 снова провер ет, как и на
этапе 110, вл етс ли MPEG-4-поток аудиоданных переформатированным МР3-потоком
аудиоданных. Последующие этапы 152 и 154 также соответствуют этапам 112 и 114
процедуры фиг.7.
Вместо изменени обратных указателей в дополнительной информации и индекса
Страница: 16
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
скорости передачи в битах в заголовках кадра, блок 100 восстановлени МР3
восстанавливает, согласно способу по фиг.8, на этапе 156, исходную длину блока данных
в исходных МР3-потоках аудиоданных, преобразованных в MPEG-4-поток аудиоданных, на
основе частоты дискретизации, скорости передачи в битах и бита заполнени . Частота
дискретизации и индикаци заполнени показаны в MPEG_l_2_SpecificConfig, а также
скорость передачи в битах в каждом элементе канала, если последний отличаетс от
кадра к кадру.
Уравнение дл вычислени исходной длины кадра исходного и подлежащего
восстановлению потока аудиоданных снова вл етс таким же, что и вышеупом нутое:
дл уровн 3 стандарта MPEG 1:
длина кадра [бит] = 1152 ? скорость передачи в битах [бит/сек] / частота
дискретизации [бит/сек] + 8 ? бит заполнени [бит]
дл уровн 3 стандарта MPEG 2:
длина кадра [бит] = 576 ? скорость передачи в битах [бит/сек] / частота дискретизации
[бит/сек] + 8 ? бит заполнени [бит].
Затем МР3-поток аудиоданных или МР3-потоки аудиоданных, соответственно,
генерируютс посредством расположени соответствующих заголовков кадра из
соответствующего канала на интервале вычисленной длины блока данных, и промежутки
заполн ютс путем вставки аудиоданных или основных данных, соответственно, в
положени х, указанных указател ми в дополнительной информации. В отличие от
вариантов осуществлени по фиг.7 или 5, соответственно, основные данные, св занные с
соответствующим заголовком или соответствующей дополнительной информацией,
соответственно, вставл ютс в МР3-поток аудиоданных в начале положени , указанного
обратным указателем. Или другими словами, начало динамических основных данных
смещаетс соответственно значению main_data_begin. Заголовок MPEG-4-файла
опускаетс . Результирующий МР3-поток аудиоданных или результирующие МР3-потоки
аудиоданных, соответственно, соответствуют исходным МР3-потокам аудиоданных, на
которых основан MPEG-4-поток аудиоданных. Таким образом, эти МР3-потоки аудиоданных
могли бы декодироватьс известными MP3-декодерами в аудиосигналы, подобно потокам
аудиоданных по фиг.7.
С учетом предыдущего описани следует отметить, что МР3-потоки аудиоданных,
описанные как одноканальные МР3-потоки аудиоданных, в некоторых ситуаци х
фактически уже были двухканальными МР3-потоками аудиоданных, заданными согласно
стандарту ISO/IEC 13818-3, однако в описании не привод тс такие подробности,
поскольку они не принципиальны дл сущности насто щего изобретени . Матричные
операции из передаваемых каналов дл выделени входного канала на стороне декодера и
использование различных обратных указателей в этих многоканальных сигналах не
описывалось, но дана ссылка на соответствующие стандарты.
Вышеупом нутые варианты осуществлени обеспечили возможность сохран ть MP3блоки данных в измененной форме в формате MPEG-4-файла. Форматы MPEG-1/2-audiolayer-3, короткий MP3 или частные форматы, подобные форматам MPEG2.5 или mp3PR0,
выведенным из них, могут быть упакованы в MPEG-4-файл на основе этих процедур, так
что такое новое представление представл ет многоканальное представление
произвольного числа каналов простым способом. Использование сложного и
трудноприменимого способа из стандарта ISO/IEC 13818-3 не требуетс . В частности, MP3блоки данных упаковываютс так, что каждый блок - элемент канала блока доступа относитс к определенной метке времени.
В других вариантах осуществлени дл изменени формата цифрового представлени сигнала, части представлени были перезаписаны другими данными. Иными словами,
информаци , требуема или полезна дл декодера, записываетс на части MP3-блока
данных, котора посто нна дл различных блоков в пределах потока данных.
Путем упаковки нескольких блоков стерео- и моноданных в блок доступа формата
MPEG-4-файла, можно получить многоканальное представление, которое значительно
Страница: 17
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
проще обрабатывать по сравнению с представлением из стандарта ISO/IEC 13818-3.
В предыдущих вариантах осуществлени представление MP3-блока данных было
форматировано таким образом, что все данные, относ щиес к определенной метке
времени, включаютс в один блок доступа. В основном это имеет место не в случае MP3блоков данных, поскольку элемент main_data_begin или обратный указатель в исходном
MP3-блоке данных, соответственно, может указывать на более ранние блоки данных.
Также можно выполнить восстановление исходного потока данных (фиг.8). Как показано,
это означает, что найденные потоки данных могут обрабатыватьс любым
соответствующим декодером.
Вышеупом нутые варианты осуществлени обеспечивают возможность кодировани или декодировани более двух каналов. Далее, в вышеупом нутых вариантах
осуществлени , уже закодированные MP3 - данные должны только переформатироватьс простыми операци ми, чтобы получить многоканальный формат. С другой стороны, на
стороне кодера, только эта операци или операции, соответственно, должны быть
реверсированы.
Хот МР3-поток данных обычно включает в себ блоки данных различных длин,
поскольку динамические данные, относ щиес к одному блоку, могут быть упакованы в
предыдущие блоки, в предыдущих вариантах осуществлени динамические данные
комплектовались непосредственно после дополнительной информации. Результирующий
MPEG-4-поток аудиоданных имел посто нную среднюю скорость передачи в битах, но
блоки данных различных длин. Элемент main_data_begin или обратный указатель,
соответственно, передаетс неизмененным способом, чтобы гарантировать
воспроизведение исходного потока данных.
Далее, со ссылкой на фиг.5, расширение MPEG-4-синтаксиса было описано дл упаковки
нескольких MP3-блоков данных в качестве MP3-элементов канала, в один многоканальный
формат в MPEG-4-файле. Все входные данные MP3-элемента канала, относ щиес к
одному моменту времени, были упакованы в один блок доступа. Соответственно стандарту
MPEG-4 подход ща информаци дл конфигурации на стороне кодера может быть вз та
из так называемой функции AudioSpecificConfig. Кроме параметра audioObjectType,
скорости передачи в битах и конфигурации канала и т.п., она включает в себ дескриптор, релевантный дл соответствующего параметра audioObjectType. Этот
дескриптор описан выше дл MPEG_l_2_SpecificConfig.
Согласно предыдущим вариантам осуществлени 12-битовое MPEG 1/2 синхрослово в
заголовке было заменено на длину соответствующего MP3-элемента канала. Согласно
стандарту ISO/IEC 13818-3 дл этого достаточно 12 битов. Остающийс заголовок никак
не измен лс , что может, однако, иногда делатьс дл укорочени , например, заголовка
кадра и остаточной избыточной части, за исключением синхрослова, чтобы уменьшить
количество передаваемой информации.
Различные вариации вышеупом нутых вариантов осуществлени могут быть легко
выполнены. Так, последовательность этапов на фиг.3, 7, 8 может измен тьс , в
частности, этапы 42, 50, 56, 60 на фиг.3, этапы 11, 114, 118, 122 и 128 на фиг.7 и
этапы 152, 154, 156 на фиг.8.
Далее, в отношении фиг.3, 7, 8 следует отметить, что показанные там этапы
выполн ютс посредством соответствующих признаков преобразовател или блока
восстановлени устройства, соответственно, согласно фиг.2 или 6, что можно
реализовать, например, с помощью компьютера или аппаратно реализованной схемы.
В варианте осуществлени по фиг.7 манипул ци заголовками дополнительной
информации соответственно (этапы 118, 122) была выполнена дл MP3-декодеров на
стороне приемника или декодера, соответственно, дл МР3-потока данных, незначительно
измененного по сравнению с исходным потоком аудиоданных. Во многих случа х
применени может быть выгодным выполн ть упом нутые этапы на стороне кодера или
передатчика, соответственно, поскольку устройства приемника часто бывают устройствами
серийного выпуска, так что экономи на электронных средствах на стороне приемника
Страница: 18
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
позволила бы получить более высокую прибыль. Согласно альтернативному варианту
осуществлени можно, таким образом, обеспечить выполнение этих этапов уже во врем преобразовани форматов MP3-MPEG-4 данных. Этапы согласно этому альтернативному
способу преобразовани форматов показаны на фиг.9, причем этапы, идентичные этапам
по фиг.3, обозначены теми же ссылочными позици ми и повторно не описываютс .
Сначала МР3-поток аудиоданных, который должен преобразовыватьс , принимаетс на
этапе 40, и на этапе 42 аудиоданные, относ щиес к метке времени или представл ющие
кодирование периода времени аудиосигнала, который должен кодироватьс МР3-потоком
аудиоданных, относ щимс к соответствующей метке времени, соответственно,
объедин ютс в непрерывный блок; указанна процедура осуществл етс дл всех меток
времени. Заголовки снова прибавл ютс к непрерывным блокам, чтобы получить элементы
канала (этап 50). Однако заголовки не только модифицируютс посредством замены слова
синхронизации на длину соответствующего элемента канала как на этапе 56. Более того,
на этапах 180 и 182, соответствующих этапам 118 и 122 фиг.7, следуют дальнейшие
модификации. На этапе 180 указатель в дополнительной информации каждого элемента
канала устанавливаетс на ноль, и на этапе 182 индекс скорости передачи в битах в
заголовке каждого элемента канала измен етс , как описано выше, причем длина MP3блока данных, завис ща от скорости передачи в битах, вл етс достаточной, чтобы
включить все аудиоданные этого элемента канала или относ щиес к метке времени,
соответственно, вместе с размером заголовка и дополнительной информацией. Этап 182
может также содержать преобразование битов заполнени в заголовках последовательных
элементов канала дл получени точной скорости передачи в битах позже при подаче
MPEG-4-потока аудиоданных, сформированного способом по фиг.9, в декодер,
работающий способом по фиг.7, но без этапов 118 и 122. Также заполнение может
выполн тьс на стороне декодера на этапе 128.
На этапе 182 может быть полезным устанавливать индекс скорости передачи в битах не
на наивысшее возможное значение, как описано дл этапа 122. Значение также может
устанавливатьс на минимальное значение, которое вл етс достаточным, чтобы
вместить все аудиоданные, заголовок и дополнительную информацию элемента канала в
вычисленной длине MP3-кадра, что также может означать, что в случае прохождени кодированного аудиофрагмента, который может быть кодирован с меньшим количеством
коэффициентов, индекс скорости передачи в битах снижаетс .
После упом нутых модификаций, на этапах 60 и 62, просто генерируетс заголовок
файла (AudioSpecificConfig), и затем он выводитс вместе с MP3-элементами канала как
MPEG-4-поток аудиоданных. Этот поток может, как уже упоминалось, воспроизводитьс способом по фиг.7, в котором, однако, этапы 118 и 122 могут быть опущены, что
облегчает реализацию на стороне декодера. Однако этапы 42, 50, 56, 180, 182 и 60
могут выполн тьс в любом пор дке.
Предшествующее описание только иллюстративно относитс к МР3-потокам
аудиоданных с фиксированной битовой длиной блока данных, выраженной в битах.
Разумеетс , МР3-потоки данных с варьируемой длиной блока данных могут
обрабатыватьс согласно предыдущим вариантам осуществлени , в которых индекс
скорости передачи в битах и, таким образом, также длина блока данных измен етс от
кадра к кадру.
Предыдущее описание относилось к МР3-потокам аудиоданных. В других потоках
аудиоданных, не основанных на указател х, вариант осуществлени насто щего
изобретени обеспечивает модификацию заголовков в блоках данных, например, одного
потока аудиоданных уровн 2 стандарта MPEG 1/2, содержащего, помимо заголовков,
подход щую дополнительную информацию и подход щие аудиоданные, и таким образом,
уже самодостаточного дл генерации MPEG-4-потока аудиоданных. Модификаци обеспечивает каждый заголовок индикацией длины, показывающей количество данных
любого из соответствующего блока данных или аудиоданных в соответствующем блоке
данных, так что MPEG-4-поток аудиоданных может декодироватьс более просто,
Страница: 19
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
особенно, когда он объедин етс из нескольких потоков аудиоданных уровн 2 стандарта
MPEG 1/2 в многоканальный поток аудиоданных, подобно вышеприведенному описанию со
ссылкой на фиг.5. Предпочтительно, модификаци получаетс вышеописанным способом
путем замены синхрослов или другой избыточной части в заголовках потока данных уровн 2 стандарта MPEG 1/2 на индикацию длины. Переформатирование или аннулирование
указател до фиг.5 путем объединени аудиоданных, относ щихс к одной метке времени,
опускаетс в потоках данных уровн 2, поскольку там не существует обратных
указателей. Декодирование MPEG-4-потока аудиоданных, объединенного из двух потоков
аудиоданных уровн 2 стандарта MPEG 1/2, представл ющих два канала многоканального
потока аудиоданных, может быть легко выполнено посредством считывани индикаций
длины и доступа к отдельным элементам канала в блоках доступа, основанных на них.
Затем они могут передаватьс в известные декодеры, совместимые с уровнем MPEG 1/2.
Далее, дл насто щего изобретени несущественно, где точно находитс обратный
указатель в блоках данных потока аудиоданных, основанного на указател х. Он может
быть непосредственно в заголовках кадра дл определени непрерывного блока
определени .
В частности, следует отметить, что в зависимости от условий, соответствующа изобретению схема преобразовани формата файла также может быть реализована в
программном обеспечении. Это может быть выполнено на цифровой запоминающей среде,
в частности, на диске или CD (компакт диске) с электронным считыванием управл ющих
сигналов, который может действовать совместно с программируемой компьютерной
системой так, чтобы выполн лс соответствующий способ. Таким образом, в принципе,
изобретение заключаетс также в компьютерном программном продукте с программным
кодом, сохраненным на машиночитаемом носителе дл выполнени способа,
соответствующего изобретению, когда компьютерный программный продукт выполн етс на компьютере. Другими словами, изобретение может также быть реализовано в виде
компьютерной программы с программным кодом дл выполнени способа, когда
компьютерна программа исполн етс на компьютере.
Формула изобретени 1. Способ преобразовани первого потока (10) аудиоданных, представл ющего
кодированный аудиосигнал и имеющего первый формат файла, во второй поток
аудиоданных, представл ющий кодированный аудиосигнал и имеющий второй формат
файла, при этом в соответствии с первым форматом файла первый поток аудиоданных
разделен на последовательные блоки (10а-10с) данных, каждый из которых ассоциирован с
соответствующими основными данными, полученными кодированием ассоциированного
одного из последовательных периодов времени аудиосигнала, и каждый период времени
содержит р д значений аудиосигнала, причем каждый блок данных содержит блок (14, 16)
определени и часть (18) основных данных, причем основные данные, ассоциированные с
последовательными блоками данных, последовательно упор дочены в част х основных
данных последовательных блоков данных, причем каждый блок определени содержит
указатель, указывающий на начало ассоциированных основных данных (12а-12с), конец
которых находитс перед началом основных данных (12b, 12с), ассоциированных со
следующим блоком данных, при этом способ содержит этапы
объединени (42), дл каждого блока данных, ассоциированных с ним основных данных
(44, 46) из последовательных блоков данных дл получени , дл каждого блока данных,
непрерывного блока (48);
прибавлени (50), дл каждого блока данных, непрерывного блока (48) к блоку (14,
16) определени этого блока данных дл получени последовательных элементов (52а)
канала различных длин;
упор дочени элементов канала в соответствии с пор дком последовательных периодов
времени дл получени второго потока аудиоданных; и
модифицировани (56)каждого элемента (54а-54с) канала так, чтобы он включал в себ Страница: 20
CL
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
индикацию длины, указывающую длину данных соответствующего элемента (54а-54с)
канала или длину непрерывного блока соответствующего элемента канала, причем этап
модифицировани содержит замену (56)избыточной части, идентичной дл всех блоков
определени , на индикацию длины.
2. Способ по п.1, дополнительно содержащий этап помещени (60, 62) заголовка
файла/потока данных перед вторым потоком аудиоданных, причем заголовок файла/потока
данных имеет избыточную часть, идентичную дл всех блоков определени .
3. Способ по п.1 или 2, в котором этап объединени содержит подэтапы считывани указател в блоке определени предварительно определенного блока данных;
считывани первой части основных данных, с которыми ассоциирован предварительно
определенный блок данных, из части (18) основных данных первого одного из
последовательных блоков данных, предшествующего предварительно определенному
блоку данных и содержащего начало основных данных, на которые указывает указатель
блока определени предварительно определенного блока данных;
считывани второй части основных данных, с которыми ассоциирован предварительно
определенный блок данных, из части основных данных второго одного из
последовательных блоков данных, следующего за первым блоком и содержащего конец
упом нутых основных данных; и
объединени первой и второй частей основных данных дл получени непрерывного
блока дл предварительно определенного блока данных.
4. Способ объединени первого потока аудиоданных, представл ющего первый
кодированный аудиосигнал, и второго потока аудиоданных, представл ющего
кодированный второй аудиосигнал, в многоканальный поток аудиоданных, причем способ
содержит этапы
преобразовани первого потока аудиоданных в первый подпоток аудиоданных согласно
способу по п.1 или 2; и
преобразовани второго потока аудиоданных во второй подпоток аудиоданных согласно
способу по п.1 или 2,
причем этапы упор дочени выполн ютс так, что два подпотока аудиоданных вместе
образуют многоканальный поток аудиоданных, и в многоканальном потоке аудиоданных
элементы (70а) канала первого подпотока аудиоданных и элементы (72а) канала второго
подпотока аудиоданных, содержащие соответствующий непрерывный блок, полученный
посредством объединени периодов времени кодировани , равных во времени,
упор дочены последовательно в непрерывном блоке (78) доступа.
5. Способ по п.4, дополнительно содержащий этап помещени заголовка файла/потока
данных перед вторым потоком аудиоданных, причем заголовок файла/потока данных
включает в себ индикацию формата, показывающую, в каком пор дке элементы (70а)
канала первого подпотока аудиоданных и второго подпотока (70b) аудиоданных
упор дочены в блоках (78) доступа.
6. Способ по п.1 или 2, в котором блоки данных представл ют собой блоки данных
равного или заданного варьируемого размера в зависимости от индикации частоты
дискретизации и индикации битовой скорости передачи в блоке определени упом нутых
блоков данных.
7. Способ преобразовани первого потока аудиоданных, представл ющего
кодированный аудиосигнал и имеющего первый формат файла, во второй поток
аудиоданных, представл ющий кодированный аудиосигнал и имеющий второй формат
файла, при этом в соответствии с первым форматом файла первый поток аудиоданных
делитс на последовательные блоки данных, каждый из которых ассоциирован с
соответствующими основными данными, полученными кодированием ассоциированного
одного из последовательных периодов времени аудиосигнала, и каждый период времени
содержит р д значений аудиосигнала, при этом блок данных содержит блок определени и
часть основных данных, при этом способ содержит этап модифицировани блоков данных
так, чтобы они включали в себ индикацию длины, указывающую длину блоков данных или
Страница: 21
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
длину основных данных блока данных, чтобы получить элементы канала, образующие
второй поток аудиоданных из блоков данных, причем этап модифицировани включает в
себ замену избыточной части, идентичной дл всех блоков определени , на индикацию
длины.
8. Способ по п.1 или 2, дополнительно содержащий этапы переустановки (180)
указателей в блоках определени так, чтобы они
показывали, в качестве начала соответствующих основных данных, что основные
данные начинаютс непосредственно после соответствующего блока определени ; и
изменени (182) индикации битовой скорости передачи в блоках определени так, что
длина блока данных, завис ща от индикации битовой скорости передачи согласно
первому формату аудиофайла, достаточна дл приема соответствующего блока
определени и ассоциированных с ним основных данных.
9. Способ декодировани второго потока аудиоданных, представл ющего кодированный
аудиосигнал и имеющего второй формат файла, посредством декодера, имеющего
возможность декодировани первого потока аудиоданных, представл ющего кодированный
аудиосигнал и имеющего первый формат файла, дл получени аудиосигнала, при этом в
соответствии с первым форматом файла первый поток аудиоданных делитс на
последовательные блоки (10а-10с) данных, каждый из которых ассоциирован с
соответствующими основными данными, полученными кодированием ассоциированного
одного из последовательных периодов времени аудиосигнала, причем каждый период
времени содержит р д значений аудиосигнала, причем каждый блок данных имеет блок
(14, 16) определени и часть (18) основных данных, причем основные данные,
ассоциированные с последовательными блоками данных, последовательно упор дочены в
част х основных данных последовательных блоков данных, каждый блок определени включает в себ указатель, указывающий на начало ассоциированных основных данных
(12а-12с), конец которых находитс перед началом основных данных (12а-12с),
ассоциированных со следующим блоком данных, причем второй поток аудиоданных
разделен на последовательные элементы канала в соответствии со вторым форматом
файла, при этом каждый элемент канала содержит непрерывный блок (44, 46), полученный
путем объединени основных данных, ассоциированных с соответствующим блоком
данных из последовательных блоков данных, и ассоциированный блок определени в
форме, в которой ранее избыточна часть, котора идентична дл всех блоков
определени , модифицирована путем замены на индикацию длины, указывающую длину
соответствующего элемента канала или длину соответствующего непрерывного блока,
причем способ содержит этапы
формировани входного потока данных, представл ющего кодированный аудиосигнал и
имеющего первый формат файла, из второго потока аудиоданных посредством:
синтаксического анализа второго потока аудиоданных путем использовани индикаций
длины,
переустановки указателей в блоках определени элементов канала второго потока
аудиоданных так, чтобы они показывали в качестве начала основных данных, что основные
данные начинаютс непосредственно после соответствующего блока определени , чтобы
получить переустановленные блоки определени ,
изменени индикации битовой скорости передачи в блоках определени элементов
канала второго потока аудиоданных так, что длина блока данных, завис ща от индикации
битовой скорости передачи согласно второму формату аудиофайла, достаточна дл приема соответствующего блока определени и ассоциированных основных данных, чтобы
получить измененные по битовой скорости передачи и переустановленные блоки
определени , и
вставки битов между каждым элементом канала и последующим элементом канала так,
чтобы длина каждого элемента канала плюс вставленные биты была адаптирована к
индикации увеличенной битовой скорости передачи; и
подачи входного потока данных в декодер согласно индикации измененной битовой
Страница: 22
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
скорости передачи, чтобы получить аудиосигнал.
10. Устройство дл преобразовани первого потока (10) аудиоданных, представл ющего
кодированный аудиосигнал и имеющего первый формат файла, во второй поток
аудиоданных, представл ющий кодированный аудиосигнал и имеющий второй формат
файла, при этом в соответствии с первым форматом файла, первый поток аудиоданных
разделен на последовательные блоки (10а-10с) данных, каждый из которых ассоциирован с
соответствующими основными данными, полученными кодированием ассоциированного
одного из последовательных периодов времени аудиосигнала, и каждый период времени
содержит р д значений аудиосигнала, причем каждый блок данных содержит блок (14, 16)
определени и часть (18) основных данных, причем основные данные, ассоциированные с
последовательными блоками данных, последовательно упор дочены в част х основных
данных последовательных блоков данных, причем каждый блок определени содержит
указатель, указывающий на начало ассоциированных основных данных (12а-12с), конец
которых находитс перед началом основных данных (12b, 12с), ассоциированных со
следующим блоком данных, содержащее
средство дл объединени (42), дл каждого блока данных, ассоциированных с ним
основных данных (44, 46) из последовательных блоков данных дл получени , дл каждого
блока данных, непрерывного блока (48);
средство дл прибавлени (50), дл каждого блока данных, непрерывного блока (48) к
блоку (14, 16) определени этого блока данных дл получени последовательных
элементов (52а) канала различных длин;
средство дл упор дочени элементов канала в соответствии с пор дком
последовательных периодов времени дл получени второго потока аудиоданных; и
средство дл модифицировани (56)каждого элемента (54а-54с) канала так, чтобы он
включал в себ индикацию длины, указывающую длину данных соответствующего
элемента (54а-54с) канала или длину непрерывного блока соответствующего элемента
канала, причем средство дл модифицировани обеспечивает замену (56) избыточной
части, идентичной дл всех блоков определени , на индикацию длины.
11. Устройство дл преобразовани первого потока аудиоданных, представл ющего
кодированный аудиосигнал и имеющего первый формат файла, во второй поток
аудиоданных, представл ющий кодированный аудиосигнал и имеющий второй формат
файла, при этом в соответствии с первым форматом файла первый поток аудиоданных
делитс на последовательные блоки данных, каждый из которых ассоциирован с
соответствующими основными данными, полученными кодированием ассоциированного
одного из последовательных периодов времени аудиосигнала, и каждый период времени
содержит р д значений аудиосигнала, при этом блок данных содержит блок определени и
часть основных данных, содержащее средство дл модифицировани блоков данных так,
чтобы они включали в себ индикацию длины, указывающую длину блоков данных или
длину основных данных блока данных, чтобы получить элементы канала, образующие
второй поток аудиоданных из блоков данных, причем средство дл модифицировани обеспечивает замену избыточной части, идентичной дл всех блоков определени , на
индикацию длины.
12. Устройство дл декодировани второго потока аудиоданных, представл ющего
кодированный аудиосигнал и имеющего второй формат файла, на основе декодера,
имеющего возможность декодировани первого потока аудиоданных, представл ющего
кодированный аудиосигнал и имеющего первый формат файла, дл получени аудиосигнала, при этом в соответствии с первым форматом файла первый поток
аудиоданных делитс на последовательные блоки (10а-10с) данных, каждый из которых
ассоциирован с соответствующими основными данными, полученными кодированием
ассоциированного одного из последовательных периодов времени аудиосигнала, причем
каждый период времени содержит р д значений аудиосигнала, причем каждый блок данных
имеет блок (14, 16) определени и часть (18) основных данных, причем основные данные,
ассоциированные с последовательными блоками данных, последовательно упор дочены в
Страница: 23
RU 2 335 022 C2
5
10
15
20
25
30
35
част х основных данных последовательных блоков данных, каждый блок определени включает в себ указатель, указывающий на начало ассоциированных основных данных
(12а-12с), конец которых находитс перед началом основных данных (12а-12с),
ассоциированных со следующим блоком данных, причем второй поток аудиоданных
разделен на последовательные элементы канала в соответствии со вторым форматом
файла, при этом каждый элемент канала содержит непрерывный блок (44, 46), полученный
путем объединени основных данных, ассоциированных с соответствующим блоком
данных из последовательных блоков данных, и ассоциированный блок определени в
форме, в которой ранее избыточна часть, котора идентична дл всех блоков
определени , модифицирована путем замены на индикацию длины, указывающую длину
соответствующего элемента канала или длину соответствующего непрерывного блока
определени , содержащее
средство дл формировани входного потока данных, представл ющего кодированный
аудиосигнал и имеющего первый формат файла, из второго потока аудиоданных
посредством:
синтаксического анализа второго потока аудиоданных путем использовани индикаций
длины,
переустановки указателей в блоках определени элементов канала второго потока
аудиоданных так, чтобы они показывали в качестве начала основных данных, что основные
данные начинаютс непосредственно после соответствующего блока определени , чтобы
получить переустановленные блоки определени ,
изменени индикации битовой скорости передачи в блоках определени элементов
канала второго потока аудиоданных так, что длина блока данных, завис ща от индикации
битовой скорости передачи согласно второму формату аудиофайла, достаточна дл приема соответствующего блока определени и ассоциированных основных данных, чтобы
получить измененные по скорости битовой передачи и переустановленные блоки
определени , и
вставки битов между каждым элементом канала и последующим элементом канала так,
чтобы длина каждого элемента канала плюс вставленные биты была адаптирована к
индикации увеличенной битовой скорости передачи; и
средство дл подачи входного потока данных в декодер согласно индикации измененной
битовой скорости передачи, чтобы получить аудиосигнал.
13. Машиночитаемый носитель, предназначенный дл взаимодействи с
программируемой компьютерной системой под действием считываемых управл ющих
сигналов в виде программных кодов, сохраненных на машиночитаемом носителе, дл преобразовани первого потока аудиоданных, имеющего первый формат файла, во второй
поток аудиоданных, имеющий второй формат файла, способом по п.1 или 7 или дл декодировани второго потока аудиоданных, имеющего второй формат файла, способом
по п.9.
40
45
50
Страница: 24
RU 2 335 022 C2
Страница: 25
DR
RU 2 335 022 C2
Страница: 26
RU 2 335 022 C2
Страница: 27
RU 2 335 022 C2
Страница: 28
RU 2 335 022 C2
Страница: 29
RU 2 335 022 C2
Страница: 30
RU 2 335 022 C2
Страница: 31
етс значение битов
заполнени , которое показано в заголовках MP3-кадра hF, hC, hS и может использоватьс дл того, чтобы точно устанавливать скорость передачи в битах. Частота дискретизации
вл етс фиксированной, поскольку она определ ет, с какой скоростью воспроизводитс декодированный аудиосигнал. Преобразование скорости передачи в битах по сравнению с
исходной настройкой позвол ет подгон ть такие МР3-элементы 74-74c канала к длине
блока данных нового, подлежащего генерации МР3-потока аудиоданных, которые длиннее,
чем исходный, поскольку дл генерации исходного потока аудиоданных, основные данные
генерировались заимствованием битов из битового резервуара.
Таким образом, хот в насто щем варианте осуществлени индекс скорости передачи в
битах всегда устанавливаетс на наивысшее допустимое значение, можно было бы
дополнительно увеличить индекс скорости передачи в битах только до значени ,
достаточного дл получени длины блока данных согласно стандарту MP3, чтобы даже
самые длинные МР3-элементы канала 74a-74c могли бы подгон тьс с учетом их длины.
Ссылочной позицией 126 иллюстрируетс , что обратный указатель main_data_begin
устанавливаетс на 0 в результирующей дополнительной информации. Это означает
только то, что в МР3-потоке аудиоданных, генерированном согласно способу по фиг.7,
блоки данных всегда вл ютс самодостаточными, так что основные данные дл определенного заголовка кадра и дополнительной информации всегда начинаютс непосредственно после дополнительной информации и в пределах того же блока данных.
Этапы 114, 118, 122 выполн ютс на каждом элементе канала путем выделени каждого
элемента канала из их блоков доступа, причем индикации длины элементов канала могут
быть использованы при выделении.
Затем на этапе 128 то количество данных заполнени или битов безразличного
Страница: 15
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
состо ни прибавл етс к каждому элементу канала 74a-74c, чтобы увеличить длину всех
МР3-элементов канала единообразно до длины MP3-блока данных, установленной новым
индексом скорости передачи в битах, 0xE. Эти данные заполнени показаны ссылочной
позицией 128 на фиг.5. Количество данных заполнени может быть вычислено дл каждого
элемента канала, например, посредством оценки индикации длины элемента канала и бита
заполнени .
Затем на этапе 130 элементы канала, показанные на фиг.5 ссылочными позици ми 74a'74c', модифицированные согласно предыдущим этапам, посылаютс в соответствующий
MP3-декодер или в элемент 134a-134c декодера в виде блоков данных МР3-потока
аудиоданных в пор дке кодированных меток времени. Заголовок MPEG-4-файла
опускаетс . Результирующие МР3-потоки аудиоданных показаны на фиг.5 в целом
ссылочными позици ми 132a, 132b и 132c. Элементы 134a-134c MP3-декодера, например,
были инициализированы перед тем, как такое же число элементов канала включено в
отдельные блоки доступа.
В реконструирующем MP3-устройстве 100 из оценки параметра channelConfiguration
вызова в функции AudioSpecificConfig MPEG-4-потока аудиоданных, известно, какой из
элементов 74a-74c канала в блоке 78 доступа MPEG-4-потока аудиоданных принадлежит
какому из МР3-потоков аудиоданных, которые должны генерироватьс . Таким образом,
элемент 134a декодера, подключенный к переднему громкоговорителю, принимает поток
132a аудиоданных, соответствующий переднему каналу, и, соответственно, элементы 134b
и 134c декодера принимают потоки 132b и 132c аудиоданных, св занные с центральным
каналом и каналом объемного звучани , и вывод т результирующие аудиосигналы в
соответственно расположенные громкоговорители, например, в низкочастотный динамик,
или в громкоговорители, расположенные, например, сзади слева и сзади справа,
соответственно.
Конечно, дл кодировани MPEG-4-потока аудиоданных в реальном масштабе времени
с использованием конфигурации по фиг.6 с элементами 102, 102' или 134a-134c декодера
требуетс передавать заново генерированные МР3-потоки 132a-132c аудиоданных со
скоростью передачи в битах, увеличенной на этапе 122, котора выше, чем в исходном
потоке 10 аудиоданных, что, однако, не вл етс проблемой, поскольку схема между
блоком 100 восстановлени МР3 и MP3-декодерами 102, 102' или 134a-134c вл етс фиксированной, так что здесь каналы передачи соответственно короткие и могут
проектироватьс с соответственно высокой скоростью передачи в битах с более низкой
стоимостью и трудозатратами.
Согласно варианту осуществлени , описанному со ссылкой на фиг.7, многоканальный
MPEG-4-поток аудиоданных, полученный согласно фиг.5 из исходных потоков 10
аудиоданных, не был реконвертирован точно в исходные МР3-потоки аудиоданных, но
другие МР3-потоки аудиоданных были генерированы из него, причем в противоположность
исходным потокам аудиоданных все обратные указатели устанавливаютс на 0, а индекс
скорости передачи в битах устанавливаетс на наивысшее значение. Таким образом, блоки
данных этих заново генерированных МР3-потоков аудиоданных вл ютс самодостаточными, если все данные, св занные с определенной меткой времени,
включаютс в один и тот же блок данных, и дл увеличени длины блока данных до
единообразного значени использовались данные заполнени .
Фиг.8 показывает вариант осуществлени способа, согласно которому можно
реконвертировать MPEG-4-поток аудиоданных, генерированный согласно вариантам
осуществлени по фиг.1-5, в исходные МР3-аудиопотоки или исходный МР3-поток
аудиоданных, соответственно.
В данном случае блок 100 восстановлени MP3 на этапе 150 снова провер ет, как и на
этапе 110, вл етс ли MPEG-4-поток аудиоданных переформатированным МР3-потоком
аудиоданных. Последующие этапы 152 и 154 также соответствуют этапам 112 и 114
процедуры фиг.7.
Вместо изменени обратных указателей в дополнительной информации и индекса
Страница: 16
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
скорости передачи в битах в заголовках кадра, блок 100 восстановлени МР3
восстанавливает, согласно способу по фиг.8, на этапе 156, исходную длину блока данных
в исходных МР3-потоках аудиоданных, преобразованных в MPEG-4-поток аудиоданных, на
основе частоты дискретизации, скорости передачи в битах и бита заполнени . Частота
дискретизации и индикаци заполнени показаны в MPEG_l_2_SpecificConfig, а также
скорость передачи в битах в каждом элементе канала, если последний отличаетс от
кадра к кадру.
Уравнение дл вычислени исходной длины кадра исходного и подлежащего
восстановлению потока аудиоданных снова вл етс таким же, что и вышеупом нутое:
дл уровн 3 стандарта MPEG 1:
длина кадра [бит] = 1152 ? скорость передачи в битах [бит/сек] / частота
дискретизации [бит/сек] + 8 ? бит заполнени [бит]
дл уровн 3 стандарта MPEG 2:
длина кадра [бит] = 576 ? скорость передачи в битах [бит/сек] / частота дискретизации
[бит/сек] + 8 ? бит заполнени [бит].
Затем МР3-поток аудиоданных или МР3-потоки аудиоданных, соответственно,
генерируютс посредством расположени соответствующих заголовков кадра из
соответствующего канала на интервале вычисленной длины блока данных, и промежутки
заполн ютс путем вставки аудиоданных или основных данных, соответственно, в
положени х, указанных указател ми в дополнительной информации. В отличие от
вариантов осуществлени по фиг.7 или 5, соответственно, основные данные, св занные с
соответствующим заголовком или соответствующей дополнительной информацией,
соответственно, вставл ютс в МР3-поток аудиоданных в начале положени , указанного
обратным указателем. Или другими словами, начало динамических основных данных
смещаетс соответственно значению main_data_begin. Заголовок MPEG-4-файла
опускаетс . Результирующий МР3-поток аудиоданных или результирующие МР3-потоки
аудиоданных, соответственно, соответствуют исходным МР3-потокам аудиоданных, на
которых основан MPEG-4-поток аудиоданных. Таким образом, эти МР3-потоки аудиоданных
могли бы декодироватьс известными MP3-декодерами в аудиосигналы, подобно потокам
аудиоданных по фиг.7.
С учетом предыдущего описани следует отметить, что МР3-потоки аудиоданных,
описанные как одноканальные МР3-потоки аудиоданных, в некоторых ситуаци х
фактически уже были двухканальными МР3-потоками аудиоданных, заданными согласно
стандарту ISO/IEC 13818-3, однако в описании не привод тс такие подробности,
поскольку они не принципиальны дл сущности насто щего изобретени . Матричные
операции из передаваемых каналов дл выделени входного канала на стороне декодера и
использование различных обратных указателей в этих многоканальных сигналах не
описывалось, но дана ссылка на соответствующие стандарты.
Вышеупом нутые варианты осуществлени обеспечили возможность сохран ть MP3блоки данных в измененной форме в формате MPEG-4-файла. Форматы MPEG-1/2-audiolayer-3, короткий MP3 или частные форматы, подобные форматам MPEG2.5 или mp3PR0,
выведенным из них, могут быть упакованы в MPEG-4-файл на основе этих процедур, так
что такое новое представление представл ет многоканальное представление
произвольного числа каналов простым способом. Использование сложного и
трудноприменимого способа из стандарта ISO/IEC 13818-3 не требуетс . В частности, MP3блоки данных упаковываютс так, что каждый блок - элемент канала блока доступа относитс к определенной метке времени.
В других вариантах осуществлени дл изменени формата цифрового представлени сигнала, части представлени были перезаписаны другими данными. Иными словами,
информаци , требуема или полезна дл декодера, записываетс на части MP3-блока
данных, котора посто нна дл различных блоков в пределах потока данных.
Путем упаковки нескольких блоков стерео- и моноданных в блок доступа формата
MPEG-4-файла, можно получить многоканальное представление, которое значительно
Страница: 17
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
проще обрабатывать по сравнению с представлением из стандарта ISO/IEC 13818-3.
В предыдущих вариантах осуществлени представление MP3-блока данных было
форматировано таким образом, что все данные, относ щиес к определенной метке
времени, включаютс в один блок доступа. В основном это имеет место не в случае MP3блоков данных, поскольку элемент main_data_begin или обратный указатель в исходном
MP3-блоке данных, соответственно, может указывать на более ранние блоки данных.
Также можно выполнить восстановление исходного потока данных (фиг.8). Как показано,
это означает, что найденные потоки данных могут обрабатыватьс любым
соответствующим декодером.
Вышеупом нутые варианты осуществлени обеспечивают возможность кодировани или декодировани более двух каналов. Далее, в вышеупом нутых вариантах
осуществлени , уже закодированные MP3 - данные должны только переформатироватьс простыми операци ми, чтобы получить многоканальный формат. С другой стороны, на
стороне кодера, только эта операци или операции, соответственно, должны быть
реверсированы.
Хот МР3-поток данных обычно включает в себ блоки данных различных длин,
поскольку динамические данные, относ щиес к одному блоку, могут быть упакованы в
предыдущие блоки, в предыдущих вариантах осуществлени динамические данные
комплектовались непосредственно после дополнительной информации. Результирующий
MPEG-4-поток аудиоданных имел посто нную среднюю скорость передачи в битах, но
блоки данных различных длин. Элемент main_data_begin или обратный указатель,
соответственно, передаетс неизмененным способом, чтобы гарантировать
воспроизведение исходного потока данных.
Далее, со ссылкой на фиг.5, расширение MPEG-4-синтаксиса было описано дл упаковки
нескольких MP3-блоков данных в качестве MP3-элементов канала, в один многоканальный
формат в MPEG-4-файле. Все входные данные MP3-элемента канала, относ щиес к
одному моменту времени, были упакованы в один блок доступа. Соответственно стандарту
MPEG-4 подход ща информаци дл конфигурации на стороне кодера может быть вз та
из так называемой функции AudioSpecificConfig. Кроме параметра audioObjectType,
скорости передачи в битах и конфигурации канала и т.п., она включает в себ дескриптор, релевантный дл соответствующего параметра audioObjectType. Этот
дескриптор описан выше дл MPEG_l_2_SpecificConfig.
Согласно предыдущим вариантам осуществлени 12-битовое MPEG 1/2 синхрослово в
заголовке было заменено на длину соответствующего MP3-элемента канала. Согласно
стандарту ISO/IEC 13818-3 дл этого достаточно 12 битов. Остающийс заголовок никак
не измен лс , что может, однако, иногда делатьс дл укорочени , например, заголовка
кадра и остаточной избыточной части, за исключением синхрослова, чтобы уменьшить
количество передаваемой информации.
Различные вариации вышеупом нутых вариантов осуществлени могут быть легко
выполнены. Так, последовательность этапов на фиг.3, 7, 8 может измен тьс , в
частности, этапы 42, 50, 56, 60 на фиг.3, этапы 11, 114, 118, 122 и 128 на фиг.7 и
этапы 152, 154, 156 на фиг.8.
Далее, в отношении фиг.3, 7, 8 следует отметить, что показанные там этапы
выполн ютс посредством соответствующих признаков преобразовател или блока
восстановлени устройства, соответственно, согласно фиг.2 или 6, что можно
реализовать, например, с помощью компьютера или аппаратно реализованной схемы.
В варианте осуществлени по фиг.7 манипул ци заголовками дополнительной
информации соответственно (этапы 118, 122) была выполнена дл MP3-декодеров на
стороне приемника или декодера, соответственно, дл МР3-потока данных, незначительно
измененного по сравнению с исходным потоком аудиоданных. Во многих случа х
применени может быть выгодным выполн ть упом нутые этапы на стороне кодера или
передатчика, соответственно, поскольку устройства приемника часто бывают устройствами
серийного выпуска, так что экономи на электронных средствах на стороне приемника
Страница: 18
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
позволила бы получить более высокую прибыль. Согласно альтернативному варианту
осуществлени можно, таким образом, обеспечить выполнение этих этапов уже во врем преобразовани форматов MP3-MPEG-4 данных. Этапы согласно этому альтернативному
способу преобразовани форматов показаны на фиг.9, причем этапы, идентичные этапам
по фиг.3, обозначены теми же ссылочными позици ми и повторно не описываютс .
Сначала МР3-поток аудиоданных, который должен преобразовыватьс , принимаетс на
этапе 40, и на этапе 42 аудиоданные, относ щиес к метке времени или представл ющие
кодирование периода времени аудиосигнала, который должен кодироватьс МР3-потоком
аудиоданных, относ щимс к соответствующей метке времени, соответственно,
объедин ютс в непрерывный блок; указанна процедура осуществл етс дл всех меток
времени. Заголовки снова прибавл ютс к непрерывным блокам, чтобы получить элементы
канала (этап 50). Однако заголовки не только модифицируютс посредством замены слова
синхронизации на длину соответствующего элемента канала как на этапе 56. Более того,
на этапах 180 и 182, соответствующих этапам 118 и 122 фиг.7, следуют дальнейшие
модификации. На этапе 180 указатель в дополнительной информации каждого элемента
канала устанавливаетс на ноль, и на этапе 182 индекс скорости передачи в битах в
заголовке каждого элемента канала измен етс , как описано выше, причем длина MP3блока данных, завис ща от скорости передачи в битах, вл етс достаточной, чтобы
включить все аудиоданные этого элемента канала или относ щиес к метке времени,
соответственно, вместе с размером заголовка и дополнительной информацией. Этап 182
может также содержать преобразование битов заполнени в заголовках последовательных
элементов канала дл получени точной скорости передачи в битах позже при подаче
MPEG-4-потока аудиоданных, сформированного способом по фиг.9, в декодер,
работающий способом по фиг.7, но без этапов 118 и 122. Также заполнение может
выполн тьс на стороне декодера на этапе 128.
На этапе 182 может быть полезным устанавливать индекс скорости передачи в битах не
на наивысшее возможное значение, как описано дл этапа 122. Значение также может
устанавливатьс на минимальное значение, которое вл етс достаточным, чтобы
вместить все аудиоданные, заголовок и дополнительную информацию элемента канала в
вычисленной длине MP3-кадра, что также может означать, что в случае прохождени кодированного аудиофрагмента, который может быть кодирован с меньшим количеством
коэффициентов, индекс скорости передачи в битах снижаетс .
После упом нутых модификаций, на этапах 60 и 62, просто генерируетс заголовок
файла (AudioSpecificConfig), и затем он выводитс вместе с MP3-элементами канала как
MPEG-4-поток аудиоданных. Этот поток может, как уже упоминалось, воспроизводитьс способом по фиг.7, в котором, однако, этапы 118 и 122 могут быть опущены, что
облегчает реализацию на стороне декодера. Однако этапы 42, 50, 56, 180, 182 и 60
могут выполн тьс в любом пор дке.
Предшествующее описание только иллюстративно относитс к МР3-потокам
аудиоданных с фиксированной битовой длиной блока данных, выраженной в битах.
Разумеетс , МР3-потоки данных с варьируемой длиной блока данных могут
обрабатыватьс согласно предыдущим вариантам осуществлени , в которых индекс
скорости передачи в битах и, таким образом, также длина блока данных измен етс от
кадра к кадру.
Предыдущее описание относилось к МР3-потокам аудиоданных. В других потоках
аудиоданных, не основанных на указател х, вариант осуществлени насто щего
изобретени обеспечивает модификацию заголовков в блоках данных, например, одного
потока аудиоданных уровн 2 стандарта MPEG 1/2, содержащего, помимо заголовков,
подход щую дополнительную информацию и подход щие аудиоданные, и таким образом,
уже самодостаточного дл генерации MPEG-4-потока аудиоданных. Модификаци обеспечивает каждый заголовок индикацией длины, показывающей количество данных
любого из соответствующего блока данных или аудиоданных в соответствующем блоке
данных, так что MPEG-4-поток аудиоданных может декодироватьс более просто,
Страница: 19
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
особенно, когда он объедин етс из нескольких потоков аудиоданных уровн 2 стандарта
MPEG 1/2 в многоканальный поток аудиоданных, подобно вышеприведенному описанию со
ссылкой на фиг.5. Предпочтительно, модификаци получаетс вышеописанным способом
путем замены синхрослов или другой избыточной части в заголовках потока данных уровн 2 стандарта MPEG 1/2 на индикацию длины. Переформатирование или аннулирование
указател до фиг.5 путем объединени аудиоданных, относ щихс к одной метке времени,
опускаетс в потоках данных уровн 2, поскольку там не существует обратных
указателей. Декодирование MPEG-4-потока аудиоданных, объединенного из двух потоков
аудиоданных уровн 2 стандарта MPEG 1/2, представл ющих два канала многоканального
потока аудиоданных, может быть легко выполнено посредством считывани индикаций
длины и доступа к отдельным элементам канала в блоках доступа, основанных на них.
Затем они могут передаватьс в известные декодеры, совместимые с уровнем MPEG 1/2.
Далее, дл насто щего изобретени несущественно, где точно находитс обратный
указатель в блоках данных потока аудиоданных, основанного на указател х. Он может
быть непосредственно в заголовках кадра дл определени непрерывного блока
определени .
В частности, следует отметить, что в зависимости от условий, соответствующа изобретению схема преобразовани формата файла также может быть реализована в
программном обеспечении. Это может быть выполнено на цифровой запоминающей среде,
в частности, на диске или CD (компакт диске) с электронным считыванием управл ющих
сигналов, который может действовать совместно с программируемой компьютерной
системой так, чтобы выполн лс соответствующий способ. Таким образом, в принципе,
изобретение заключаетс также в компьютерном программном продукте с программным
кодом, сохраненным на машиночитаемом носителе дл выполнени способа,
соответствующего изобретению, когда компьютерный программный продукт выполн етс на компьютере. Другими словами, изобретение может также быть реализовано в виде
компьютерной программы с программным кодом дл выполнени способа, когда
компьютерна программа исполн етс на компьютере.
Формула изобретени 1. Способ преобразовани первого потока (10) аудиоданных, представл ющего
кодированный аудиосигнал и имеющего первый формат файла, во второй поток
аудиоданных, представл ющий кодированный аудиосигнал и имеющий второй формат
файла, при этом в соответствии с первым форматом файла первый поток аудиоданных
разделен на последовательные блоки (10а-10с) данных, каждый из которых ассоциирован с
соответствующими основными данными, полученными кодированием ассоциированного
одного из последовательных периодов времени аудиосигнала, и каждый период времени
содержит р д значений аудиосигнала, причем каждый блок данных содержит блок (14, 16)
определени и часть (18) основных данных, причем основные данные, ассоциированные с
последовательными блоками данных, последовательно упор дочены в част х основных
данных последовательных блоков данных, причем каждый блок определени содержит
указатель, указывающий на начало ассоциированных основных данных (12а-12с), конец
которых находитс перед началом основных данных (12b, 12с), ассоциированных со
следующим блоком данных, при этом способ содержит этапы
объединени (42), дл каждого блока данных, ассоциированных с ним основных данных
(44, 46) из последовательных блоков данных дл получени , дл каждого блока данных,
непрерывного блока (48);
прибавлени (50), дл каждого блока данных, непрерывного блока (48) к блоку (14,
16) определени этого блока данных дл получени последовательных элементов (52а)
канала различных длин;
упор дочени элементов канала в соответствии с пор дком последовательных периодов
времени дл получени второго потока аудиоданных; и
модифицировани (56)каждого элемента (54а-54с) канала так, чтобы он включал в себ Страница: 20
CL
RU 2 335 022 C2
5
10
15
20
25
30
35
40
45
50
индикацию длины, указывающую длину данных соответствующего элемента (54а-54с)
канала или длину непрерывного блока соответствующего элемента канала, причем этап
модифицировани содержит замену (56)избыточной части, идентичной дл всех блоков
определени , на индикацию длины.
2. Способ по п.1, дополнительно содержащий этап помещени (60, 62) заголовка
файла/потока данных перед вторым потоком аудиоданных, причем заголовок файла/потока
данных имеет избыточную часть, идентичную дл всех блоков определени .
3. Способ по п.1 или 2, в котором этап объединени содержит подэтапы считывани указател в блоке определени предварительно определенного блока данных;
считывани первой части основных данных, с которыми ассоциирован предварительно
определенный блок данных, из части (18) основных данных первого одного из
последовательных блоков данных, предшествующего предварительно определенному
блоку данных и содержащего начало основных данных, на которые указывает указатель
блока определени предварительно определенного блока данных;
считывани второй части основных данных, с которыми ассоциирован предварительно
определенный блок данных, из части основных данных второго одного из
последовательных блоков данных, следующего за первым блоком и содержащего конец
упом нутых основных данных; и
объединени первой и второй частей основных данных дл получени непрерывного
блока дл предварительно определенного блока данных.
4. Способ объединени первого потока аудиоданных, представл ющего первый
кодированный аудиосигнал, и второго потока аудиоданных, представл ющего
кодированный 
Документ
Категория
Без категории
Просмотров
0
Размер файла
780 Кб
Теги
1/--страниц
Пожаловаться на содержимое документа