10-05-Кодирование текстовой информации (1)

Содержание

Слайд 2

Зачем нужно

Целью процесса кодирования информации является определение количества информации или вычисление информационного

Зачем нужно Целью процесса кодирования информации является определение количества информации или вычисление
объёма, необходимого для сохранения информации для последующей обработки

Слайд 3

Задача определения количества информации

Используются два подхода:
вероятностный (содержательный);
количество информации зависит от содержания сообщения
(по

Задача определения количества информации Используются два подхода: вероятностный (содержательный); количество информации зависит
объему информации отметка за зачет отличается от отметки за экзамен)
алфавитный
количество информации не зависит от содержания сообщения
(сообщение из газеты может быть без информации)

Слайд 4

Вероятностный подход

Сообщение несет в себе информацию о событии.
Бит – это количество информации,

Вероятностный подход Сообщение несет в себе информацию о событии. Бит – это
соответствующее выбору одного из двух равновозможных вариантов.
Количество информации зависит от количества возможных вариантов события.
Формула Шеннона: i=log2 N (или N=2i )
i – информационный объем сообщения
N – количество равновероятных вариантов события

Слайд 5

Алфавитный подход

Сообщение представляет собой последовательность символов алфавита
Алфавит – набор неповторяющихся символов для

Алфавитный подход Сообщение представляет собой последовательность символов алфавита Алфавит – набор неповторяющихся
кодирования информации
Количество информации зависит от количества символов и информационного веса символа
V=K•i W=2i
V – информационный объем сообщения
K – количество символов сообщения
i – информационный вес одного символа алфавита
W – количество символов алфавита

Слайд 6

Примеры задач

Определить объём каждого сообщения:
ЁЖИК В ТУМАНЕ
Ёжик в тумане

Формулы:
V=K•i W=2i
V – информационный объем

Примеры задач Определить объём каждого сообщения: ЁЖИК В ТУМАНЕ Ёжик в тумане
сообщения
K – количество символов сообщения
i – информационный вес одного символа алфавита
W – количество символов алфавита

Слайд 7

Примеры задач

Для ко­ди­ро­ва­ния не­ко­то­рой по­сле­до­ва­тель­но­сти, со­сто­я­щей из букв К, Л, М, Н,

Примеры задач Для ко­ди­ро­ва­ния не­ко­то­рой по­сле­до­ва­тель­но­сти, со­сто­я­щей из букв К, Л, М,
ре­ши­ли ис­поль­зо­вать не­рав­но­мер­ный дво­ич­ный код, удо­вле­тво­ря­ю­щий усло­вию Фано. Для буквы Н ис­поль­зо­ва­ли ко­до­вое слово 0, для буквы К — ко­до­вое слово 10. Ка­ко­ва наи­мень­шая воз­мож­ная сум­мар­ная длина всех четырёх ко­до­вых слов?
При­ме­ча­ние.
Усло­вие Фано озна­ча­ет, что ни­ка­кое ко­до­вое слово не яв­ля­ет­ся на­ча­лом дру­го­го ко­до­во­го слова. Это обес­пе­чи­ва­ет воз­мож­ность од­но­знач­ной рас­шиф­ров­ки за­ко­ди­ро­ван­ных со­об­ще­ний.
1) 7 2) 8 3) 9 4) 10

Слайд 8

Задачи для решения

Для кодирования некоторой последовательности, состоящей из букв А, Б, В,

Задачи для решения Для кодирования некоторой последовательности, состоящей из букв А, Б,
Г и Д, используется неравномерный двоичный код, позволяющий однозначно декодировать полученную двоичную последовательность. Вот этот код: А — 1; Б — 0100; В — 000; Г — 011; Д — 0101. Требуется сократить для одной из букв длину кодового слова так, чтобы код по-прежнему можно было декодировать однозначно. Коды остальных букв меняться не должны. Каким из указанных способов это можно сделать?
1) для буквы Г — 11 2) для буквы В — 00 3) для буквы Г — 01 4) это не­воз­мож­но
Определить количество символов алфавита:
сообщение объёмом 200 бит содержит 40 символов
сообщения, содержащего 4096 символов, объёмом 1/512 части Мбайта
Определить количество символов сообщения объёмом 300 бит:
написанного при помощи только строчных латинских букв
написанного при помощи только строчных русских букв
Перекодировка сообщения
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 16 байтов. Сколько бит было в первоначальном сообщении?
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?