Цифровая компрессия аудиоданных в ЦРВ. Лекция 1,2

Содержание

Слайд 2

Системы ЦРВ

Системы ЦРВ

Слайд 3

Система цифрового звукового вещания DAB (Digital Audio Broadcasting) предназначена
для доставки высококачественных звуковых

Система цифрового звукового вещания DAB (Digital Audio Broadcasting) предназначена для доставки высококачественных
программ и данных, передаваемых
наземными и спутниковыми передатчиками в метровом (88...114 МГц)
и дециметровом (0,5...2 ГГц) диапазонах частот и принимаемых автомобильными,
переносными и стационарными приемниками цифровых сигналов, а также распределяемых
с помощью кабельных сетей. Система DAB разработана для так называемой
одночастотной передающей сети (ОЧС).

В системе DAB используются широкополосные радиоканалы с одновременной передачей
в них нескольких звуковых программ, множества сигналов данных, разнообразной сервисной
и другой полезной информации. Она совместима с другими службами радиосвязи.

На сегодняшний день в мире получили распространение несколько технологий
цифрового радио.
Это европейская система Eureka – 147 (DAB), продвигаемая в США концепция IBOC,
система низкочастотного (до 30 МГц) цифрового вещания DRM (Digital Radio Mondiale –
всемирное цифровое радио), а также цифровое спутниковое вещание в формате DSR
(Digitale Satelliten Radio).

Слайд 4

Структурная схема цифровой системы передачи сигналов

Структурная схема цифровой системы передачи сигналов

Слайд 5

Уровень, Дб

Уровень, Дб

Кривая слышимости человеческого слуха

В отсутствие громких звуков

В присутствии тонального звука

Уровень, Дб Уровень, Дб Кривая слышимости человеческого слуха В отсутствие громких звуков В присутствии тонального звука

Слайд 6

Эффект частотного (статического) маскирования

Эффект частотного (статического) маскирования

Слайд 7

Эффект временного (динамического) маскирования

Уровень, Дб

t

Длительность маскирующего тона

Маскирование
«назад»

Маскирование
«вперед»

Эффект временного (динамического) маскирования Уровень, Дб t Длительность маскирующего тона Маскирование «назад» Маскирование «вперед»

Слайд 8

Преобразование спектра сигнала при компрессии аудиоданных

Преобразование спектра сигнала при компрессии аудиоданных

Слайд 9

Психоакустические модели (ПАМ):

1. NMR (Noise to Mask Ratio)

3. PERCEVAL (PERCeptual EVALution).

Психоакустические модели (ПАМ): 1. NMR (Noise to Mask Ratio) 3. PERCEVAL (PERCeptual

2. PAQM (Perceptual Audio Quality Measure)
ASPEC (Adaptive Spectral Perceptual Entropy Coding,
ATRAC/АТАС (Adaptive Transform Acoustic Coding, США).

Методы кодирования и компрессии:

1. Субполосное кодирование

MUSICAM (Masking Pattern Adapted Universal Subband Integrated
Coding and Multiplexing),

2. Кодирование с преобразованием

Слайд 10

Характеристики кодирования источника

20 моно...4 стерео

Характеристики кодирования источника 20 моно...4 стерео

Слайд 11

Набор
фильтров (32)

Компрессия
аудиоданных

Определение
К масшт.

Сокращение
избыточной
информации

БПФ

Динамическое
распределение
бит

Дополнительные
данные

Желаемая
скорость

Оценка

Набор фильтров (32) Компрессия аудиоданных Определение К масшт. Сокращение избыточной информации БПФ
порога
слышимости

Мультиплексирование

Цифровой ЗС

В канал

Структурная схема монофонического кодера MUSICAM

Слайд 12

Банк фильтров
(32 субполосы)

БПФ
(1024 отсчета
ЗС)

Динамическое
распределение
бит

Расчет
масштабных
коэффициентов

Психоакустическая
модель

Формирование
гранул

Кодирование
дополнительной
информации

Установка
скорости
цифр. потока

Банк фильтров (32 субполосы) БПФ (1024 отсчета ЗС) Динамическое распределение бит Расчет

(32…384 кбит/с)

Форматирование,
контроль ошибок
(CRC)

Масштабирование,
равномерное
квантование и
кодирование ЗС

Цифровой ЗС
ИКМ, 768 кбит/с

Кодированный аудиосигнал, 32…384кбит/с

Функционирование кодера MUSICAM

Слайд 13

Алгоритм работы кодера MPEG 11172-3 по методу MUSICAM

Алгоритм работы кодера MPEG 11172-3 по методу MUSICAM

Слайд 14

Частотный анализ ЗС в кодере MUSICAM

Частотный анализ ЗС в кодере MUSICAM

Слайд 15

Демультиплексирование

Декомпрессия
аудиоданных

Декодирование

Инверсный
банк фильтров

Вход

К масшт

Распределение
бит

Выход

Цифровой ЗС

Структурная схема декодера MUSICAM

Демультиплексирование Декомпрессия аудиоданных Декодирование Инверсный банк фильтров Вход К масшт Распределение бит

Слайд 16

Структурная схема декодера MPEG 11172-3

Структурная схема декодера MPEG 11172-3

Слайд 17

Семейство кодеков MPEG
(Motion Pictures Experts Group)

1. MPEG – 1 (ISO/IEC 11172)

2.

Семейство кодеков MPEG (Motion Pictures Experts Group) 1. MPEG – 1 (ISO/IEC
MPEG – 2 (ISO/IEC 13818)

3. MPEG – 4 (ISO/IEC 14496)

4. MPEG – 7 (ISO/IEC WD 15938)

5. ATSC AC – 3 (Dolby AC – 3)

Слайд 18

Профили стандарта MPEG-1

11172 – 1 «Системы». Описывает синхронизацию и мультиплексирование
потоков видео

Профили стандарта MPEG-1 11172 – 1 «Системы». Описывает синхронизацию и мультиплексирование потоков
и аудио в единый поток, пригодный для цифровой записи или
передачи.

11172 – 2 «Видео». Определяет кодированное представление сжатых видео
последовательностей с 625- и 525-строчным разложением и прогрессивной
разверткой до скоростей ~1,5 Мбит/с.

11172 – 3 «Звук». Определяет кодированное представление сжатых аудио
данных (моно- и стерео).

11172 – 4 «Проверка соответствия». Описывает процедуры тестирования
цифрового потока и декодера на соответствие профилям 1…3.

11172 – 5 «Эталонное программное обеспечение». Примеры реализации ПО
для п. 1…3.

«Информационные технологии – Кодирование движущихся изображений
и сопровождающего звука для цифровой записи со скоростями до 1,5 Мбит/с»

Слайд 19

Профили стандарта MPEG-2

Информационные технологии – Обобщенное кодирование движущихся
изображений и сопровождающей

Профили стандарта MPEG-2 Информационные технологии – Обобщенное кодирование движущихся изображений и сопровождающей
звуковой информации.

13818 – 1 «Системы». Описывает мультиплексирование одного или нескольких
ЭП видео, аудио и др. данных в одно- или многопрограммный поток, пригодный
для записи или передачи.

13818 – 2 «Видео». Определяет средства компрессии видеоданных при
прогрессивной и чересстрочной развертке, а также процесс декодирования,
необходимый для восстановления изображения.

13818 – 3 «Звук». Представляет обратно совместимое расширение звукового
стандарта MPEG – 1.

13818 – 4 «Соответствие». Описывает процедуры тестирования
цифрового потока и декодера на соответствие профилям 1…3.

13818 – 5 «Моделирование ПО». Примеры реализации ПО
для п. 1…3.

13818 – 6 «DSM – CC».Определяет набор протоколов по управлению
цифровыми потоками MPEG – 1 и MPEG – 2.

13818 – 7 «ААС». Описывает алгоритм кодирования многоканального звука
ААС, не совместимый с MPEG – 1.

13818 – 9 «Интерфейс реального времени для декодеров». Описывает
интерфейс реального времени для декодеров транспортного потока.

13818 – 10 «Соответствие для DSM – CC». Определяет расширение для
совместимости с DSM – CC.

Слайд 20

Профили стандарта MPEG - 4

Информационные технологии – Обобщенное кодирование аудиовизуальных
объектов.

14496 – 1

Профили стандарта MPEG - 4 Информационные технологии – Обобщенное кодирование аудиовизуальных объектов.
«Системы». Определяет описание сцены, мультиплексирование,
синхронизацию, управление буфером.

14496 – 2 «Визуальные средства». Определяет кодированное представление
натуральных и синтетических визуальных объектов.

14496 – 3 «Звук». Описывает кодированное представление натуральных и
синтетических звуковых объектов.

14496 – 4 «Проверка соответствия». Описывает процедуры тестирования
цифрового потока и декодера на соответствие профилям 1…3.

14496 – 5 «Рекомендуемое ПО». Содержит программные модули
большинства компонентов MPEG – 4 для построения совместимых
устройств.

14496 – 6 «DMIF». Определяет сеансовый протокол управления
мультимедийными потоками в обобщенной среде.

Слайд 21

Профили 3 «Звук» семейства стандартов MPEG

Стандарт MPEG – 1 (ISO/IEC 11172 -

Профили 3 «Звук» семейства стандартов MPEG Стандарт MPEG – 1 (ISO/IEC 11172
3) рекомендуется для кодирования
высококачественных моно- и двухканальных стереосигналов, предусматривает
три значения Fдискр. = 32; 44,1 и 48 кГц.

Стандарт MPEG – 2 (ISO/IEC 13818 - 3) это обратно совместимая с MPEG – 1
версия метода кодирования ЗС различных форматов: 1/0; 2/0; 3/1; 3/2; 5.1;
сигналов систем Dolby (Dolby Stereo; Dolby Surround; Dolby Pro Logic и др.).
Использует дополнительно к имеющимся в MPEG – 1 Fдискр. = 16; 22,05 и 24 кГц.

Стандарт MPEG – 2 (ISO/IEC 13818 – 7 ААС) предназначен для
высококачественного (по стандартам EBU (ЕСР)) кодирования в полной полосе
частот (до 20 кГц) при скоростях передачи ~64 кбит/с.

Стандарт MPEG – 4 (ISO/IEC 14496 - 3) ориентирован на мультимедийные
приложения. Расширяет возможности между мультимедиа терминалами
мобильного доступа низкой сложности до высококачественных звуковых
систем.

Слайд 22

Уровни (слои) стандартов MPEG

Layer I (слой 1) рекомендуется для применения в

Уровни (слои) стандартов MPEG Layer I (слой 1) рекомендуется для применения в
профессиональной области
в системах записи-перезаписи с высоким студийным качеством с достаточной
емкостью памяти. Характеризуется небольшой сложностью и невысокой
степенью компрессии (редукции) аудиоданных. Скорость цифрового потока
192…256 Кбит/с; коэффициент компрессии ~4, задержка сигнала при обработке
~20мс.

Layer II (слой 2) потребительская область применения, высококачественное РВ.
Средняя сложность и средняя степень компрессии аудиоданных. Рекомендуемая
скорость цифрового потока 128 Кбит/с при кодировании ЗС в полосе частот
40…15 кГц; коэффициент компрессии ~6, задержка сигнала при обработке
40…50 мс

Layer III (слой 3) рекомендуется для передачи ЗС по сети ISDN в
профессиональной области со средним качеством, Интернет – вещания.
Отличается высокой сложностью и следующими параметрами: скорость
цифрового потока 64 Кбит/с при полосе ЗС 40…15 кГц, коэффициент
компрессии ~ 12, время задержки более 50 мс.

Слайд 23

Относительная сложность кодеков MPEG - 1

Относительная сложность кодеков MPEG - 1

Слайд 24

Структурная схема кодера MPEG – 1 (ISO/IEC 11172-3) Layer I и Layer

Структурная схема кодера MPEG – 1 (ISO/IEC 11172-3) Layer I и Layer
II
(МР1 и МР2)

Банк фильтров
32 субполосы
(PQMF-фильтры)

Нормирование
субполосных
отсчетов ЗС

Квантование
субполосных
отсчетов ЗС

Кодирование
субполосных
отсчетов ЗС


0

31


0

31

Расчет
масштабных
коэффициентов

Кодирование
дополнительной
информации

ПАМ 1
NMR
БПФ (512 ˅ 1024)

Динамическое
распределение
бит

Формирование
цифровых потоков и
помехоустойчивое
кодирование

ИКМ-сигнал, fд= 48 кГц, ΔА=16 бит/отсчет, v=768 кбит/с

Установка скорости
цифрового потока

Кодированный аудиосигнал,
v = 32…384 кбит/с

Глобальный порог
маскировки

Слайд 25

Структурная схема кодера MPEG – 1 (ISO/IEC 11172-3) Layer III (МР3)

Банк фильтров
32

Структурная схема кодера MPEG – 1 (ISO/IEC 11172-3) Layer III (МР3) Банк
субполосы

Сегментация по
времени, расчет
коэффициентов
МДКП


31


576

0

1

576 или 3х192
коэффициента МДКП

Hybrid PQMF
Filter Bank

Образование
блоков
и неравномерное
квантование
коэффициентов
МДКП

Кодер
Хаффмана
(энтропийное
кодирование)

Кодирование
дополнительной
информации

Формирование
цифровых потоков и
помехоустойчивое
кодирование

Резервуар
бит

ПАМ 2
(модифицированная)

Входной ИКМ
сигнал

Установка скорости
цифрового потока

Итерационное распределение бит

Кодированный аудиосигнал, v=32…256 кбит/с

Глобальный порог маскировки
и психоакустическая энтропия

Слайд 26

Декодер стандарта MPEG - 1 (ISO/IEC 11172-3) Layer II

Декодер стандарта MPEG - 1 (ISO/IEC 11172-3) Layer II

Слайд 27

Структура аудиофрейма стандарта MPEG ISO/IEC 11172-3 Layer II

Структура аудиофрейма стандарта MPEG ISO/IEC

Структура аудиофрейма стандарта MPEG ISO/IEC 11172-3 Layer II Структура аудиофрейма стандарта MPEG ISO/IEC 11172-3 Layer I
11172-3 Layer I

Слайд 28

Описание структуры аудиофрейма (20 бит)

1бит – бит идентификации ID, 1- поток аудиоданных

Описание структуры аудиофрейма (20 бит) 1бит – бит идентификации ID, 1- поток
полностью соответствует MPEG 11172-3
0- нет (MPEG-2)

2 бита – код уровня (слой кодирования: Layer-I; Layer-II; Layer-III; резерв)

1 бит – бит защиты, 1 – не применяется помехоустойчивое кодирование
0 - применяется

4 бита – скорость цифрового потока для каждого слоя кодирования (32…448 кБит/с для Layer-I;
32…384 кБит/с для Layer-II; 32…320 кБит/с для Layer-III)

2 бита – частота дискретизации: 44,1; 48 или 32 кГц

1 бит – паддинг, 1- частота дискретизации равна 44,1 кГц
0 - иначе

1 бит – для передачи дополнительной информации

2 бита – код режима передачи: стерео, совмещенное стерео, 2 независимых канала, один канал

2 бита – код режима расширения при передаче в режиме Joint Stereo

1 бит – бит права копирования, равен 0, если копирование запрещено

1 бит – оригинал/копия, равен 1, если передается оригинал

2 бита – код предыскажения

Слайд 29

Header
(Преамбула,
заголовок
аудиофрейма)
32 бита

CRC-16
16 бит

Bit Allocation
88 бит

SCFSI
2 бита на
субполосу
(2х32)

SCF
6…18 бит
на субполосу

Subband

Header (Преамбула, заголовок аудиофрейма) 32 бита CRC-16 16 бит Bit Allocation 88
Samples (Аудиовыборки)
12 блоков по 96 отсчетов (1152)
(кодовое слово отсчета – до 16 бит)

Ancillary
Data

Аудиофрейм стандарта MPEG ISO/IEC 11172-3 Layer II

Структура аудиофрейма стандарта MPEG ISO/IEC 11172-3 Layer II

Header- служебная информация (12 бит синхрослово 111111111111 и 20 бит - описание структуры данных
аудиофрейма)

CRC – избыточные биты (остаток) CRC-16

Bit Allocation – распределение количества бит по субполосам

SCFSI – распределение масштабных коэффициентов

SCF – значения масштабных коэффициентов

Subband Samples – значения нормированных отсчетов субполосных сигналов

Ancillary Data – вспомогательные данные

Слайд 30

Структура аудиофрейма стандарта MPEG ISO/IEC 11172-3 Layer III


Аудиофрейм n - 1

Аудиофрейм n

Структура аудиофрейма стандарта MPEG ISO/IEC 11172-3 Layer III … Аудиофрейм n -

Аудиофрейм n + 1

Длинный
блок

Короткий блок 1

Короткий блок 2

Короткий блок 3

0…575

0…191

Коэффициенты МДКП

Блок данных

Слайд 32

Передаваемые сигналы в стандарте MPEG −2 ISO/IEC 13818 − 3

Передаваемые сигналы в стандарте MPEG −2 ISO/IEC 13818 − 3

Слайд 33

Кодер MPEG −1
стандарта
ISO/IEC 11172 − 3

Кодер MPEG −2
многоканального
расширения
стандарта
ISO/IEC 13818 −

Кодер MPEG −1 стандарта ISO/IEC 11172 − 3 Кодер MPEG −2 многоканального
3

М2

Декодер MPEG −1
стандарта
ISO/IEC 11172 − 3

Декодер MPEG −2
многоканального
расширения
стандарта
ISO/IEC 13818 − 3

М1

Структурная схема кодека MPEG −2 стандарта ISO/IEC 13818 − 3
(многоканальная конфигурация)

L

C

R

LS

RS

Т1

Т2

Т3

Т4

Т5

Т1

Т2

Т3

Т4

Т5

L'

C'

R'

LS'

RS'

T1 = α(L+βC+γLS);
T2 = α(R+βC+γRS);
T3 = αβC;
T4 = αγLS;
T5 = αγRS

Режим 2 Dolby Surround

Слайд 34

Структурная схема кодера MPEG-2 ISO/IEC 13818-3 Layer II

PQMF
фильтр

PQMF
фильтр

PQMF
фильтр

PQMF
фильтр

PQMF
фильтр

Сумматор
сигналов

Сумматор
сигналов

ФНЧ


ПАМ






LS

L

С

RS

R

Предварительное
квантование

Предварительное
квантование

Предварительное
квантование

М1

Т1

Т2

Т3

Т4

Т5

Выбор
каналов

К квантованию и

Структурная схема кодера MPEG-2 ISO/IEC 13818-3 Layer II PQMF фильтр PQMF фильтр
кодированию сигналов

Слайд 35

Структурная схема кодера MPEG-2 ISO/IEC 13818-3 Layer II
(продолжение)

Т1

Т2

Т3

Т4

Т5

Переключение
каналов

Выбор
каналов

Блок расчета и
кодирования SCF

Блок

Структурная схема кодера MPEG-2 ISO/IEC 13818-3 Layer II (продолжение) Т1 Т2 Т3
кодирования с
линейным
предсказанием

Блок кодирования с
динамическим
переходным затуханием

MUX

От М1

Кодер МPEG – 1
Layer II

Кодер МPEG – 1
Layer II

Кодер многоканального
расширения

От ПАМ

Квантование и кодирование сигналов

к М1

Кодированный аудиосигнал

Слайд 36

Header

CRC

BAL

SCFSI

SCF

Subband
Samples

AD
Доп. данные

Аудиофрейм стандарта MPEG - 1 ISO/IEC 11172-3 Layer II

Т1/Т2 – совместимый

Header CRC BAL SCFSI SCF Subband Samples AD Доп. данные Аудиофрейм стандарта
стереосигнал

МС –
Header

MC –
CRC

MC –
BAL

MC –
SCF

MC –
SCFSI

МС –
предсказание

МС –
Subband
Samples

Многоканальное
расширение - 2

AD
– 2

Аудиоданные многоканального расширения Т3,Т4,Т5

Многоканальное расширение

Структура данных аудиофрейма MPEG-2 стандарта ISO/IEC13818-3 Layer II
при отсутствии дополнительного расширения

Слайд 37

Header
MPEG - 1

CRC

Аудиоданные
MPEG - 1

MC –
Header

МС –аудио-
данные

МС –
Доп. данные

MC –
CRC

Аудиофрейм

Header MPEG - 1 CRC Аудиоданные MPEG - 1 MC – Header
стандарта MPEG - 2 ISO/IEC 13818-3 Layer II

Header

CRC

Аудиоданные
MPEG - 1

MC –
Header

MC –
CRC

МС –
предсказание

МС –аудио-
данные

Доп. данные

MPEG-2 аудиофрейм, совместимый с цифровым потоком MPEG-1

МС –
Доп. данные - 2

ext.
МС –аудио-
данные

ext.
длина

ext.
CRC

ext.
Sync

Цифровой поток дополнительного расширения

Структура данных аудиофрейма MPEG-2 ISO/IEC 13818-3
с дополнительным расширением

Слайд 38

Гибридный
банк
фильтров
(сегментация
ЗС по времени
и частоте

Пред.
процессор

Процедура
объединения
сигналов
(режим
Coupling)

Процедура
кодирования
сигналов
M и S
(режим M/S)

Линейное
предска
зание

ТNS
процесс

Модифицированная психоакустическая модель 2

Входной

Гибридный банк фильтров (сегментация ЗС по времени и частоте Пред. процессор Процедура
аудио сигнал

Режим Jount Stereo

Установка скорости цифрового потока, управление и
контроль искажений квантования

Формирование
цифровых потоков
и
помехоустойчивое
кодирование

Оценка
масштабных
коэффициентов

Неравномерное
квантование
коэффициентов
МДКП

Кодер
Хаффмана

Итерационный
процесс

Кодированный аудиосигнал,
V=48…576 кбит/с на канал

Структурная схема кодера MPEG – 2 ААС ISO/IEC 13818 - 7

Слайд 39

Алгоритмы компрессии цифровых данных MPEG – 4 стандарта ISO/IEC 14496 - 3

Предварительная

Алгоритмы компрессии цифровых данных MPEG – 4 стандарта ISO/IEC 14496 - 3

обработка
сигнала

Выбор алгоритма
кодирования

Параметрическое
кодирование
высоко-
качественного
ЗС

Кодирование речи
(SELP – кодер)

Субполосное
кодирование
с преобразованием
(ААС – кодер)

Модуль 1
(грубое
изменение
величины
и формы
спектра
энергии
искажений
квантования)

Модуль 2
(тонкое
изменение
величины
и формы
спектра
энергии
искажений
квантования


S(n)

Управление искажениями
квантования

Кодированный
аудиосигнал

Имя файла: Цифровая-компрессия-аудиоданных-в-ЦРВ.-Лекция-1,2.pptx
Количество просмотров: 20
Количество скачиваний: 0