Тема 2.1.2

Февраль 28, 2021

Содержание

2. Сжатие данных Алгоритмическое преобразование данных, производимое с целью уменьшения занимаемого ими объёма
3. КОЭФФИЦИЕНТ СЖАТИЯ СООТНОШЕНИЕ ИСХОДНОГО И СЖАТОГО ФАЙЛА
4. АЛГОРИТМ RLE КОДИРОВАНИЕ ЦЕПОЧЕК ОДИНАКОВЫХ СИМВОЛОВ 100 100 200 байтов Файл qq.txt Файл qq.rle (сжатый) 4
5. КОДИРОВАНИЕ ШЕННОНА — ФАНО АЛГОРИТМ ПРЕФИКСНОГО НЕОДНОРОДНОГО КОДИРОВАНИЯ. ОТНОСИТСЯ К ВЕРОЯТНОСТНЫМ МЕТОДАМ СЖАТИЯ. ИСПОЛЬЗУЕТ ИЗБЫТОЧНОСТЬ СООБЩЕНИЯ,
6. ОСНОВНЫЕ ЭТАПЫ АЛГОРИТМА ШЕННОНА — ФАНО СИМВОЛЫ ПЕРВИЧНОГО АЛФАВИТА M1 ВЫПИСЫВАЮТ ПО УБЫВАНИЮ ВЕРОЯТНОСТЕЙ. СИМВОЛЫ ПОЛУЧЕННОГО
7. ПРИМЕР КОДОВОГО ДЕРЕВА ИСХОДНЫЕ СИМВОЛЫ: A (ЧАСТОТА ВСТРЕЧАЕМОСТИ 50) B (ЧАСТОТА ВСТРЕЧАЕМОСТИ 39) C (ЧАСТОТА ВСТРЕЧАЕМОСТИ
8. КОД ШЕННОНА-ФАНО ДОСТОИНСТВА И НЕДОСТАТКИ учитывается частота символов не нужен символ-разделитель код префиксный – можно декодировать
9. АЛГОРИТМ ХАФФМАНА АЛГОРИТМ ОПТИМАЛЬНОГО ПРЕФИКСНОГО КОДИРОВАНИЯ АЛФАВИТА С МИНИМАЛЬНОЙ ИЗБЫТОЧНОСТЬЮ ЭТОТ МЕТОД КОДИРОВАНИЯ СОСТОИТ ИЗ ДВУХ
10. КЛАССИЧЕСКИЙ АЛГОРИТМ ХАФФМАНА НА ВХОДЕ ПОЛУЧАЕТ ТАБЛИЦУ ЧАСТОТ ВСТРЕЧАЕМОСТИ СИМВОЛОВ В СООБЩЕНИИ. ДАЛЕЕ НА ОСНОВАНИИ ЭТОЙ
11. ПРИМЕР ИСХОДНЫЕ СИМВОЛЫ: Полученный код:
12. АЛГОРИТМ ХАФФМАНА ДОСТОИНСТВА И НЕДОСТАТКИ код оптимальный среди алфавитных кодов нужно заранее знать частоты символов при
13. АЛГОРИТМ LZW Этот метод позволяет достичь одну из наилучших степеней сжатия среди других существующих методов сжатия
14. КОДИРОВАНИЕ Начало. Шаг 1. Все возможные символы заносятся в словарь. Во входную фразу X заносится первый
15. ПРИМЕР Пусть мы сжимаем последовательность: abacabadabacabae. Ответ: 01025039864
16. ДЕКОДИРОВАНИЕ Начало. Шаг 1. Все возможные символы заносятся в словарь. Во входную фразу X заносится первый
17. ПРИМЕР Пусть мы декодируем последовательность: 01025039864.
19. Скачать презентацию

Сжатие данных
Алгоритмическое преобразование данных, производимое с целью уменьшения занимаемого ими объёма

КОЭФФИЦИЕНТ СЖАТИЯ
СООТНОШЕНИЕ ИСХОДНОГО И СЖАТОГО ФАЙЛА

АЛГОРИТМ RLE
КОДИРОВАНИЕ ЦЕПОЧЕК ОДИНАКОВЫХ СИМВОЛОВ
100
100
200 байтов
Файл qq.txt
Файл qq.rle (сжатый)
4 байта

КОДИРОВАНИЕ ШЕННОНА — ФАНО
АЛГОРИТМ ПРЕФИКСНОГО НЕОДНОРОДНОГО КОДИРОВАНИЯ. ОТНОСИТСЯ К ВЕРОЯТНОСТНЫМ МЕТОДАМ СЖАТИЯ.
ИСПОЛЬЗУЕТ ИЗБЫТОЧНОСТЬ

СООБЩЕНИЯ, ЗАКЛЮЧЁННУЮ В НЕОДНОРОДНОМ РАСПРЕДЕЛЕНИИ ЧАСТОТ СИМВОЛОВ ЕГО (ПЕРВИЧНОГО) АЛФАВИТА, ТО ЕСТЬ ЗАМЕНЯЕТ КОДЫ БОЛЕЕ ЧАСТЫХ СИМВОЛОВ КОРОТКИМИ ДВОИЧНЫМИ ПОСЛЕДОВАТЕЛЬНОСТЯМИ, А КОДЫ БОЛЕЕ РЕДКИХ СИМВОЛОВ — БОЛЕЕ ДЛИННЫМИ ДВОИЧНЫМИ ПОСЛЕДОВАТЕЛЬНОСТЯМИ.

Слайд 6

ОСНОВНЫЕ ЭТАПЫ АЛГОРИТМА ШЕННОНА — ФАНО
СИМВОЛЫ ПЕРВИЧНОГО АЛФАВИТА M1 ВЫПИСЫВАЮТ ПО УБЫВАНИЮ ВЕРОЯТНОСТЕЙ.
СИМВОЛЫ

ПОЛУЧЕННОГО АЛФАВИТА ДЕЛЯТ НА ДВЕ ЧАСТИ, СУММАРНЫЕ ВЕРОЯТНОСТИ СИМВОЛОВ КОТОРЫХ МАКСИМАЛЬНО БЛИЗКИ ДРУГ ДРУГУ.
В ПРЕФИКСНОМ КОДЕ ДЛЯ ПЕРВОЙ ЧАСТИ АЛФАВИТА ПРИСВАИВАЕТСЯ ДВОИЧНАЯ ЦИФРА «0», ВТОРОЙ ЧАСТИ — «1».
ПОЛУЧЕННЫЕ ЧАСТИ РЕКУРСИВНО ДЕЛЯТСЯ И ИХ ЧАСТЯМ НАЗНАЧАЮТСЯ СООТВЕТСТВУЮЩИЕ ДВОИЧНЫЕ ЦИФРЫ В ПРЕФИКСНОМ КОДЕ.

Слайд 7

ПРИМЕР КОДОВОГО ДЕРЕВА
ИСХОДНЫЕ СИМВОЛЫ:
A (ЧАСТОТА ВСТРЕЧАЕМОСТИ 50)
B (ЧАСТОТА ВСТРЕЧАЕМОСТИ 39)
C (ЧАСТОТА ВСТРЕЧАЕМОСТИ

18)
D (ЧАСТОТА ВСТРЕЧАЕМОСТИ 49)
E (ЧАСТОТА ВСТРЕЧАЕМОСТИ 35)
F (ЧАСТОТА ВСТРЕЧАЕМОСТИ 24)

Полученный код: A — 11, B — 101, C — 100, D — 00, E — 011, F — 010.

Слайд 8

КОД ШЕННОНА-ФАНО
ДОСТОИНСТВА И НЕДОСТАТКИ
учитывается частота символов
не нужен символ-разделитель
код префиксный – можно декодировать

по мере поступления данных

нужно заранее знать частоты символов
код неоптимален
при ошибке в передаче сложно восстановить «хвост»
не учитывает повторяющиеся последовательности символов

Слайд 9

АЛГОРИТМ ХАФФМАНА
АЛГОРИТМ ОПТИМАЛЬНОГО ПРЕФИКСНОГО КОДИРОВАНИЯ АЛФАВИТА С МИНИМАЛЬНОЙ ИЗБЫТОЧНОСТЬЮ
ЭТОТ МЕТОД КОДИРОВАНИЯ СОСТОИТ

ИЗ ДВУХ ОСНОВНЫХ ЭТАПОВ:
ПОСТРОЕНИЕ ОПТИМАЛЬНОГО КОДОВОГО ДЕРЕВА.
ПОСТРОЕНИЕ ОТОБРАЖЕНИЯ КОД-СИМВОЛ НА ОСНОВЕ ПОСТРОЕННОГО ДЕРЕВА.

Слайд 10

КЛАССИЧЕСКИЙ АЛГОРИТМ ХАФФМАНА НА ВХОДЕ ПОЛУЧАЕТ ТАБЛИЦУ ЧАСТОТ ВСТРЕЧАЕМОСТИ СИМВОЛОВ В СООБЩЕНИИ.

ДАЛЕЕ НА ОСНОВАНИИ ЭТОЙ ТАБЛИЦЫ СТРОИТСЯ ДЕРЕВО КОДИРОВАНИЯ ХАФФМАНА (Н-ДЕРЕВО).
СИМВОЛЫ ВХОДНОГО АЛФАВИТА ОБРАЗУЮТ СПИСОК СВОБОДНЫХ УЗЛОВ. КАЖДЫЙ ЛИСТ ИМЕЕТ ВЕС, КОТОРЫЙ МОЖЕТ БЫТЬ РАВЕН ЛИБО ВЕРОЯТНОСТИ, ЛИБО КОЛИЧЕСТВУ ВХОЖДЕНИЙ СИМВОЛА В СЖИМАЕМОЕ СООБЩЕНИЕ.
ВЫБИРАЮТСЯ ДВА СВОБОДНЫХ УЗЛА ДЕРЕВА С НАИМЕНЬШИМИ ВЕСАМИ.
СОЗДАЕТСЯ ИХ РОДИТЕЛЬ С ВЕСОМ, РАВНЫМ ИХ СУММАРНОМУ ВЕСУ.
РОДИТЕЛЬ ДОБАВЛЯЕТСЯ В СПИСОК СВОБОДНЫХ УЗЛОВ, А ДВА ЕГО ПОТОМКА УДАЛЯЮТСЯ ИЗ ЭТОГО СПИСКА.
ОДНОЙ ДУГЕ, ВЫХОДЯЩЕЙ ИЗ РОДИТЕЛЯ, СТАВИТСЯ В СООТВЕТСТВИЕ БИТ 1, ДРУГОЙ — БИТ 0. БИТОВЫЕ ЗНАЧЕНИЯ ВЕТВЕЙ, ИСХОДЯЩИХ ОТ КОРНЯ, НЕ ЗАВИСЯТ ОТ ВЕСОВ ПОТОМКОВ.
ШАГИ, НАЧИНАЯ СО ВТОРОГО, ПОВТОРЯЮТСЯ ДО ТЕХ ПОР, ПОКА В СПИСКЕ СВОБОДНЫХ УЗЛОВ НЕ ОСТАНЕТСЯ ТОЛЬКО ОДИН СВОБОДНЫЙ УЗЕЛ. ОН И БУДЕТ СЧИТАТЬСЯ КОРНЕМ ДЕРЕВА.

Слайд 11

ПРИМЕР
ИСХОДНЫЕ СИМВОЛЫ:
Полученный код:

Слайд 12

АЛГОРИТМ ХАФФМАНА ДОСТОИНСТВА И НЕДОСТАТКИ
код оптимальный среди алфавитных кодов
нужно заранее знать частоты символов
при

ошибке в передаче сложно восстановить «хвост»
не учитывает повторяющиеся последовательности символов

Слайд 13

АЛГОРИТМ LZW
Этот метод позволяет достичь одну из наилучших степеней сжатия среди других

существующих методов сжатия графических данных, при полном отсутствии потерь или искажений в исходных файлах. В настоящее время используется в файлах формата TIFF, PDF, GIF, PostScript и других, а также отчасти во многих популярных программах сжатия данных (ZIP, ARJ, LHA).

Слайд 14

КОДИРОВАНИЕ
Начало.
Шаг 1. Все возможные символы заносятся в словарь. Во входную фразу X заносится первый символ

сообщения.
Шаг 2. Считать очередной символ Y из сообщения.
Шаг 3. Если Y — это символ конца сообщения, то выдать код для X, иначе:
Если фраза XY уже имеется в словаре, то присвоить входной фразе значение XY и перейти к Шагу 2 ,
Иначе выдать код для входной фразы X, добавить XY в словарь и присвоить входной фразе значение Y. Перейти к Шагу 2.
Конец.

Слайд 15

ПРИМЕР
Пусть мы сжимаем последовательность: abacabadabacabae.
Ответ: 01025039864

Слайд 16

ДЕКОДИРОВАНИЕ
Начало.
Шаг 1. Все возможные символы заносятся в словарь. Во входную фразу X заносится первый код

декодируемого сообщения.
Шаг 2. Считать очередной код Y из сообщения.
Шаг 3. Если Y — это конец сообщения, то выдать символ, соответствующий коду X, иначе:
Если фразы под кодом XY нет в словаре, вывести фразу, соответствующую коду X, а фразу с кодом XY занести в словарь.
Иначе присвоить входной фразе код XY и перейти к Шагу 2 .
Конец.

Тема 2.1.2

Содержание

Слайд 2

Сжатие данных
Алгоритмическое преобразование данных, производимое с целью уменьшения занимаемого ими объёма

Слайд 3

КОЭФФИЦИЕНТ СЖАТИЯ
СООТНОШЕНИЕ ИСХОДНОГО И СЖАТОГО ФАЙЛА

Слайд 4

АЛГОРИТМ RLE
КОДИРОВАНИЕ ЦЕПОЧЕК ОДИНАКОВЫХ СИМВОЛОВ
100
100
200 байтов
Файл qq.txt
Файл qq.rle (сжатый)
4 байта

Слайд 5

КОДИРОВАНИЕ ШЕННОНА — ФАНО
АЛГОРИТМ ПРЕФИКСНОГО НЕОДНОРОДНОГО КОДИРОВАНИЯ. ОТНОСИТСЯ К ВЕРОЯТНОСТНЫМ МЕТОДАМ СЖАТИЯ.
ИСПОЛЬЗУЕТ ИЗБЫТОЧНОСТЬ

Слайд 6

ОСНОВНЫЕ ЭТАПЫ АЛГОРИТМА ШЕННОНА — ФАНО
СИМВОЛЫ ПЕРВИЧНОГО АЛФАВИТА M1 ВЫПИСЫВАЮТ ПО УБЫВАНИЮ ВЕРОЯТНОСТЕЙ.
СИМВОЛЫ

Слайд 7

ПРИМЕР КОДОВОГО ДЕРЕВА
ИСХОДНЫЕ СИМВОЛЫ:
A (ЧАСТОТА ВСТРЕЧАЕМОСТИ 50)
B (ЧАСТОТА ВСТРЕЧАЕМОСТИ 39)
C (ЧАСТОТА ВСТРЕЧАЕМОСТИ

Слайд 8

КОД ШЕННОНА-ФАНО
ДОСТОИНСТВА И НЕДОСТАТКИ
учитывается частота символов
не нужен символ-разделитель
код префиксный – можно декодировать

Слайд 9

АЛГОРИТМ ХАФФМАНА
АЛГОРИТМ ОПТИМАЛЬНОГО ПРЕФИКСНОГО КОДИРОВАНИЯ АЛФАВИТА С МИНИМАЛЬНОЙ ИЗБЫТОЧНОСТЬЮ
ЭТОТ МЕТОД КОДИРОВАНИЯ СОСТОИТ

Слайд 10

КЛАССИЧЕСКИЙ АЛГОРИТМ ХАФФМАНА НА ВХОДЕ ПОЛУЧАЕТ ТАБЛИЦУ ЧАСТОТ ВСТРЕЧАЕМОСТИ СИМВОЛОВ В СООБЩЕНИИ.

Слайд 11

ПРИМЕР
ИСХОДНЫЕ СИМВОЛЫ:
Полученный код:

Слайд 12

АЛГОРИТМ ХАФФМАНА ДОСТОИНСТВА И НЕДОСТАТКИ
код оптимальный среди алфавитных кодов
нужно заранее знать частоты символов
при

Слайд 13

АЛГОРИТМ LZW
Этот метод позволяет достичь одну из наилучших степеней сжатия среди других

Слайд 14

КОДИРОВАНИЕ
Начало.
Шаг 1. Все возможные символы заносятся в словарь. Во входную фразу X заносится первый символ

Слайд 15

ПРИМЕР
Пусть мы сжимаем последовательность: abacabadabacabae.
Ответ: 01025039864

Слайд 16

ДЕКОДИРОВАНИЕ
Начало.
Шаг 1. Все возможные символы заносятся в словарь. Во входную фразу X заносится первый код

Слайд 17

ПРИМЕР
Пусть мы декодируем последовательность: 01025039864.

Тема 2.1.2

Содержание

Сжатие данных Алгоритмическое преобразование данных, производимое с целью уменьшения занимаемого ими объёма

КОЭФФИЦИЕНТ СЖАТИЯ СООТНОШЕНИЕ ИСХОДНОГО И СЖАТОГО ФАЙЛА

АЛГОРИТМ RLE КОДИРОВАНИЕ ЦЕПОЧЕК ОДИНАКОВЫХ СИМВОЛОВ100100200 байтовФайл qq.txtФайл qq.rle (сжатый)4 байта

КОДИРОВАНИЕ ШЕННОНА — ФАНО АЛГОРИТМ ПРЕФИКСНОГО НЕОДНОРОДНОГО КОДИРОВАНИЯ. ОТНОСИТСЯ К ВЕРОЯТНОСТНЫМ МЕТОДАМ СЖАТИЯ.ИСПОЛЬЗУЕТ ИЗБЫТОЧНОСТЬ

ОСНОВНЫЕ ЭТАПЫ АЛГОРИТМА ШЕННОНА — ФАНО СИМВОЛЫ ПЕРВИЧНОГО АЛФАВИТА M1 ВЫПИСЫВАЮТ ПО УБЫВАНИЮ ВЕРОЯТНОСТЕЙ.СИМВОЛЫ

ПРИМЕР КОДОВОГО ДЕРЕВА ИСХОДНЫЕ СИМВОЛЫ:A (ЧАСТОТА ВСТРЕЧАЕМОСТИ 50)B (ЧАСТОТА ВСТРЕЧАЕМОСТИ 39)C (ЧАСТОТА ВСТРЕЧАЕМОСТИ

КОД ШЕННОНА-ФАНОДОСТОИНСТВА И НЕДОСТАТКИучитывается частота символовне нужен символ-разделителькод префиксный – можно декодировать

АЛГОРИТМ ХАФФМАНА АЛГОРИТМ ОПТИМАЛЬНОГО ПРЕФИКСНОГО КОДИРОВАНИЯ АЛФАВИТА С МИНИМАЛЬНОЙ ИЗБЫТОЧНОСТЬЮЭТОТ МЕТОД КОДИРОВАНИЯ СОСТОИТ

КЛАССИЧЕСКИЙ АЛГОРИТМ ХАФФМАНА НА ВХОДЕ ПОЛУЧАЕТ ТАБЛИЦУ ЧАСТОТ ВСТРЕЧАЕМОСТИ СИМВОЛОВ В СООБЩЕНИИ.

ПРИМЕР ИСХОДНЫЕ СИМВОЛЫ:Полученный код:

АЛГОРИТМ ХАФФМАНА ДОСТОИНСТВА И НЕДОСТАТКИкод оптимальный среди алфавитных кодовнужно заранее знать частоты символовпри

АЛГОРИТМ LZWЭтот метод позволяет достичь одну из наилучших степеней сжатия среди других

КОДИРОВАНИЕНачало.Шаг 1. Все возможные символы заносятся в словарь. Во входную фразу X заносится первый символ

ПРИМЕРПусть мы сжимаем последовательность: abacabadabacabae. Ответ: 01025039864

ДЕКОДИРОВАНИЕНачало.Шаг 1. Все возможные символы заносятся в словарь. Во входную фразу X заносится первый код

ПРИМЕРПусть мы декодируем последовательность: 01025039864.

Похожие презентации

Сжатие данных
Алгоритмическое преобразование данных, производимое с целью уменьшения занимаемого ими объёма

КОЭФФИЦИЕНТ СЖАТИЯ
СООТНОШЕНИЕ ИСХОДНОГО И СЖАТОГО ФАЙЛА

АЛГОРИТМ RLE
КОДИРОВАНИЕ ЦЕПОЧЕК ОДИНАКОВЫХ СИМВОЛОВ
100
100
200 байтов
Файл qq.txt
Файл qq.rle (сжатый)
4 байта

КОДИРОВАНИЕ ШЕННОНА — ФАНО
АЛГОРИТМ ПРЕФИКСНОГО НЕОДНОРОДНОГО КОДИРОВАНИЯ. ОТНОСИТСЯ К ВЕРОЯТНОСТНЫМ МЕТОДАМ СЖАТИЯ.
ИСПОЛЬЗУЕТ ИЗБЫТОЧНОСТЬ

ОСНОВНЫЕ ЭТАПЫ АЛГОРИТМА ШЕННОНА — ФАНО
СИМВОЛЫ ПЕРВИЧНОГО АЛФАВИТА M1 ВЫПИСЫВАЮТ ПО УБЫВАНИЮ ВЕРОЯТНОСТЕЙ.
СИМВОЛЫ

ПРИМЕР КОДОВОГО ДЕРЕВА
ИСХОДНЫЕ СИМВОЛЫ:
A (ЧАСТОТА ВСТРЕЧАЕМОСТИ 50)
B (ЧАСТОТА ВСТРЕЧАЕМОСТИ 39)
C (ЧАСТОТА ВСТРЕЧАЕМОСТИ

КОД ШЕННОНА-ФАНО
ДОСТОИНСТВА И НЕДОСТАТКИ
учитывается частота символов
не нужен символ-разделитель
код префиксный – можно декодировать

АЛГОРИТМ ХАФФМАНА
АЛГОРИТМ ОПТИМАЛЬНОГО ПРЕФИКСНОГО КОДИРОВАНИЯ АЛФАВИТА С МИНИМАЛЬНОЙ ИЗБЫТОЧНОСТЬЮ
ЭТОТ МЕТОД КОДИРОВАНИЯ СОСТОИТ

ПРИМЕР
ИСХОДНЫЕ СИМВОЛЫ:
Полученный код:

АЛГОРИТМ ХАФФМАНА ДОСТОИНСТВА И НЕДОСТАТКИ
код оптимальный среди алфавитных кодов
нужно заранее знать частоты символов
при

АЛГОРИТМ LZW
Этот метод позволяет достичь одну из наилучших степеней сжатия среди других

КОДИРОВАНИЕ
Начало.
Шаг 1. Все возможные символы заносятся в словарь. Во входную фразу X заносится первый символ

ПРИМЕР
Пусть мы сжимаем последовательность: abacabadabacabae.
Ответ: 01025039864

ДЕКОДИРОВАНИЕ
Начало.
Шаг 1. Все возможные символы заносятся в словарь. Во входную фразу X заносится первый код

ПРИМЕР
Пусть мы декодируем последовательность: 01025039864.