ГОСТР
53556.7—
2013
ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ
НАЦИОНАЛЬНЫЙ
СТАНДАРТ
РОССИЙСКОЙ
ФЕДЕРАЦИИ
Звуковое вещание цифровое
КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ. ЧАСТЬ III (MPEG-4 AUDIO)
Параметрическое кодирование звуковых сигналов (HILN)
ISO/IEC 14496-3:2009 (NEQ)
Издание официальное
Москва
Стандартинформ
2014
Предисловие
1 РАЗРАБОТАН Санкт-Петербургским филиалом Центрального научно-исследовательского института связи «Ленинградское отделение» (ФГУП ЛО ЦНИИС)
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 480 «Связь»
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 22 ноября 2013 г. ТК 1704-ст
4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009 «Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио» (ISO/IEC 14496-3:2009 «Information technology — Coding of audio-visual objects — Part 3: Audio». NEQ)
5 ВВЕДЕН ВПЕРВЫЕ
Правипа применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в годовом (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок — в ежемесячно издаваемом информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)
О Стандартинформ. 2014
Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии
II
ГОСТ P 53556.7—2013
Содержание
1 Область действия………………………………………………………………………………………………………………………..1
1.1 Технический обзор………………………………………………………………………………………………………………….1
2 Термины и определения……………………………………………………………………………………………………………….2
3 Синтаксис потока битов……………………………………………………………………………………………………………….2
3.1 Конфигурация декодера (ParametricSpecificConfig)…………………………………………………………………..2
3.2 Фрейм потока битов (sIPacketPayload)……………………………………………………………………………………..5
4 Семантика потока битов…………………………………………………………………………………………………………….26
4.1 Конфигурация декодера (ParametricSpecificConfig)…………………………………………………………………26
4.2 Фрейм потока битов (sIPacketPayload)…………………………………………………………………………………….27
5 Инструменты параметрического декодера…………………………………………………………………………………..29
5.1 Инструменты декодера HILN…………………………………………………………………………………………………29
5.2 Интегрированный параметрический кодер……………………………………………………………………………..47
6 Устойчивые к ошибкам полезные нагрузки потока битов………………………………………………………………47
6.1 Обзор инструментов……………………………………………………………………………………………………………..47
6.2 ERHILN……………………………………………………………………………………………………………………………….48
Приложение А (справочное) Параметрический аудиокодер…………………………………………………………….49
Библиография………………………………………………………………………………………………………………………………54
III
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Звуковое вещание цифровое
КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ.
ЧАСТЬ III (MPEG-4 AUDIO)
Параметрическое кодирование звуковых сигналов (HILN)
Sound broadcasting digital
Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels A part III (MPEG-4 audio) Parametric audio coding (HILN)
Дата введения — 2014—09—01
1 Область действия
Параметрическое аудиокодирование обеспечивает инструменты HILN. которые дополняют другие инструменты кодирования естественного аудио в области уровней очень низких битовых скоростей. Их внимание сосредоточено на представлении монофонических музыкальных сигналов с низкой и промежуточной сложностью контента в диапазоне 4 — 16 Кбит/с. HILN задействует высокую степень интерактивности путем неявной поддержки изменения скорости и шага во время воспроизведения с возможностью масштабируемости скорости передачи. Кроме того возможная комбинация с инструментами параметрического кодирования речи HVXC допускает очень эффективные схемы кодирования речи и музыкальных сигналов.
1.1 Технический обзор
Параметрическое аудиокодирование MPEG-4 использует метод HILN (Гармонические и отдельные линии плюс шум), чтобы кодировать такие аудиосигналы, как музыка на скоростях передачи 4 Кбит/с и выше, используя масштабируемое параметрическое представление аудиосигнала HILN позволяет независимо изменять скорости и шаг во время декодирования. Кроме того HILN может быть объединено с параметрическим кодированием речи MPEG-4 (HVXC). чтобы сформировать интегрированный параметрический кодер, охватывающий более широкий диапазон сигналов и скоростей передачи.
Интегрированный параметрический кодер может работать в следующих режимах:
Таблица 1— Режимы работы параметрического кодера |
||||||||||
|
PARAmodes 0 и 1 представляют режимы фиксированных HVXC и HILN. PARAmode 2 разрешает автоматическое переключение между HVXC и HILN в зависимости от типа текущего входного сигнала. В PARAmode 3 декодеры HVXC и HILN могут использоваться одновременно, и их выходные сигналы добавляются (смешиваются) в параметрическом декодере.
В режимах ‘коммутируемые HVXC/HILN” и “смешанные HVXC/HILN инструменты декодера HVXC и HILN работают альтернативно или одновременно согласно PARAswitchMode или PARAmixMode те-
Издание официальное
кущего фрейма. Чтобы получить надлежащее временное выравнивание выходных сигналов декодера HVXC и HILN прежде, чем они будут добавлены, буфер FIFO компенсирует разницу во времени между задержкой декодера HVXC и HILN.
Чтобы избежать трудных переходов на границах фрейма, когда декодеры HVXC или HILN включаются или выключаются, соответствующие выходные сигналы декодера появляются и спадают постепенно. Для декодера HVXC применяется линейное изменение 20 мс. когда он включается или выключается. Декодер HILN не требует дополнительного замирания из-за гладких окон синтеза, используемых в синтезаторе HILN Необходимо только сбросить декодер HILN (numLine = 0). если текущий фрейм потока битов не содержит HILNframe ().
2 Термины и определения
В настоящем стандарте применены термины и сокращения с соответствующими определениями, используемые в ГОСТ Р 53556.0-2009.
3 Синтаксис потока битов
Естественный объект аудио MPEG-4. использующий параметрическое кодирование, передается в одном или нескольких элементарных потоках: поток базового уровня, поток дополнительного уровня улучшения и один или более дополнительных потоков уровня расширения.
Синтаксис потока битов описывается в коде pseudo-C.
Мнемоники LARH1, LARH2. LARH3. LARN1. LARN2. DIA, DIF. DHF. DFS указывают, что используется кодовая комбинация “v/c/ftf.
Мнемонический SDC указывает, что используется кодовая комбинация Vc/бГ. которая декодируется HILN SubDivisionCode. используя параметры для SDCdecode 0, как дано в описании синтаксиса потока битов.
3.1 Конфигурация декодера (ParametricSpecificConfig)
Информация о конфигурации декодера для параметрического кодирования передается в ParametricSpecificConfig 0 базового уровня и элементарном потоке уровня улучшения или расширения.
Параметрический базовый уровень — конфигурация
Параметрический кодер в немасштабируемом режиме или базовом уровне в масштабируемом режиме HILN используют ParametricSpeciricConrig () с isBaseLayer == 1.
Параметрический уровень улучшения/расширения HILN — конфигурация
Чтобы использовать HILN в качестве ядра в режиме «масштабируемый T/F с ядром», в дополнение к базовому уровню HILN требуется уровень улучшения HILN. При работе с масштабируемой скоростью передачи HILN в дополнение к базовому уровню HILN разрешаются один или более уровней расширения HILN. Уровень улучшения и уровень расширения используют ParametricSpecificConfig 0 с isBaseLayer == 0.
Таблица 2 — Синтаксис ParametricSpecificConfig () |
||||||
|
ГОСТ P 53556.7—2013
3.1.1 Конфигурация параметрического декодера аудио
Таблица 3 — Синтаксис PARAconhg () |
||||||||||||
|
Таблица 4 — PARAmode |
|||||||||||||||
|
3.1.2 Конфигурация декодера HILN
Таблица 5 — СинтаксисHILNconhg |
|||||||||||||||||||||
|
Таблица 6 — Синтаксис HILNenexConhg 0 |
||||||||||||
|
||||||||||||
3 |
Окончание таблицы 6 |
||||||
|
Таблица 7 — HILNsampleRateCode |
|||||||||||||||||||||||||||||||||||||||||||||||||||
|
Таблица 8 — linebits |
||||||||||||||||||||
|
Таблица 9 — HILNcontMode |
||||||||||
|
Число битов улучшения частоты (fEnhbits р]) в HILNenhaFrame () вычисляется следующим образом:
• отдельная линия:
fEnhbits р] = max (О. fEnhbitsBase [ILFreqlndex р]] + fEnhbitsMode [HILNenhaQuantMode])
• линия гармоники:
fEnhbits pj = max (0, fEnhbitsBase piarmFreqlndex] + fEnhbitsMode [HILNenhaQuantMode] + fEnhbitsHanm [i])
ГОСТ P 53556.7—2013
Таблица 10 — fEnbbitsBase |
||||||||||||||||||||||||
|
Таблица 11 — fEnhbilsMode |
||||||||||
|
Таблица 12 — fEnhbitsHarm |
||||||||||||
|
Таблица 13 — Константы HILN |
||||||||||||||
|
3.2 Фрейм потока битов (sIPacketPayload)
Динамические данные для параметрического кодирования передаются как пакетная полезная нагрузка SL в элементарном потоке базового уровня и дополнительного уровня улучшения или расширения
Параметрический базовый уровень — полезная нагрузка устройства доступа.
Для параметрического кодера в немасштабируемом режиме или для базового уровня в масштабируемом режиме HILN определяется следующая полезная нагрузка фрейма потока битов:
sIPacketPayload {
PARAframe ();
}
Параметрический уровень улучшения/расширения HILN— полезная нагрузка устройства доступа.
Чтобы проанализировать и декодировать уровень улучшения HILN. запрашивается декодируемая информация из базового уровня HILN.
Чтобы проанализировать и декодировать уровень расширения HILN. запрашивается декодируемая информация из базового уровня HILN и возможного нижнего уровня расширения HILN. Синтаксис потока битов уровней расширения HILN описывается способом, который требует, чтобы фреймы базового потока битов HILN и расширения анализировались в надлежащем порядке:
5
1 |
HILNbasicFrame () |
фрейм базового потока битов |
2 |
HILNextFrame (1) |
фрейм 1-го потока битов расширения (если доступен фрейм базового потока битов) |
3 |
HILNextFrame (2) |
фрейм 2-го потока битое расширения (если доступны фреймы базового потока и 1-го потока битов расширения) |
4 |
ит д |
Для уровня улучшения и уровня расширения в масштабируемом режиме HILN определяется следующая полезная нагрузка фрейма потока битов:
si Packet Payload {
HILNenexFrame ();
}
3.2.1 Фрейм параметрического потока битов аудио Таблица 14 — Синтаксис PARAframe () |
||||||
|
Таблица 15 — Синтаксис sviitchFrame () |
||||||
|
||||||
6 |
ГОСТ P 53556.7—2013
В каждом фрейме выбирается один из следующих PARAswitchModes
Таблица 16 — PARAswtchMode |
||||||
|
Таблица 17 — Синтаксис rmxFrame () |
||||||
|
В каждом фрейме выбирается один из следующих PARAmixModes: Таблица 18 — PARAmixMode
|
||||||||||
Таблица 19 — Синтаксис HVXCdoubleframe () |
|
||||||
7 |
1 Область действия
1.1 Технический обзор
2 Термины и определения
3 Синтаксис потока битов
3.1 Конфигурация декодера (ParametricSpecificConfig)
3.2 Фрейм потока битов (sIPacketPayload)
4 Семантика потока битов
4.1 Конфигурация декодера (ParametricSpecificConfig)
4.2 Фрейм потока битов (sIPacketPayload)
5 Инструменты параметрического декодера
5.1 Инструменты декодера HILN
5.2 Интегрированный параметрический кодер
6 Устойчивые к ошибкам полезные нагрузки потока битов
6.1 Обзор инструментов
6.2 ER HILN
Приложение А (справочное) Параметрический аудиокодер
Библиография
стр. 1
стр. 2
стр. 3
стр. 4
стр. 5
стр. 6
стр. 7
стр. 8
стр. 9
стр. 10
стр. 11
стр. 12
стр. 13
стр. 14
стр. 15
стр. 16
стр. 17
стр. 18
стр. 19
стр. 20
стр. 21
стр. 22
стр. 23
стр. 24
стр. 25
стр. 26
стр. 27
стр. 28
стр. 29
стр. 30