Представления текстовой и графической информации

Содержание

Слайд 2

Кодирование текстовой информации

Кодирование текстовой информации

Слайд 3

Зачем кодировать информацию?

Кодирование — это представление информации в форме, удобной для её

Зачем кодировать информацию? Кодирование — это представление информации в форме, удобной для
хранения, передачи и обработки.

В компьютерах используется двоичный код:

10101001010

данные (код)

передача

11111100010

данные (код)

хранение

передача

кодирование

обработка

Слайд 4

Кодирование символов

Текстовый файл

на экране (символы)
в памяти – коды

Файлы со шрифтами: *.fon, *.ttf,

Кодирование символов Текстовый файл на экране (символы) в памяти – коды Файлы
*.otf

Слайд 5

Кодировка ASCII (7-битная)

ASCII = American Standard Code for Information Interchange
Коды 0-127:
0-31 управляющие

Кодировка ASCII (7-битная) ASCII = American Standard Code for Information Interchange Коды
символы: 7 – звонок, 10 – новая строка, 13 – возврат каретки, 27 – Esc.
32 пробел
знаки препинания: . , : ; ! ?
специальные знаки: + - * / () {} []
48-57 цифры 0..9
65-90 заглавные латинские буквы A-Z
97-122 строчные латинские буквы a-z

Не предусмотрены

Слайд 6

8-битные кодировки

Кодовые страницы (расширения ASCII):

таблица ASCII

национальный алфавит

Для русского языка:
CP-866 для MS DOS
CP-1251

8-битные кодировки Кодовые страницы (расширения ASCII): таблица ASCII национальный алфавит Для русского
для Windows (Интернет)
КОI8-R для UNIX (Интернет)
MacCyrillic для компьютеров Apple

Проблема:

Слайд 7

8-битные кодировки

1 байт на символ – файлы небольшого размера!
просто обрабатывать в программах

нельзя

8-битные кодировки 1 байт на символ – файлы небольшого размера! просто обрабатывать
использовать символы разных кодовых страниц одновременно (русские и французские буквы, и т.п.)
неясно, в какой кодировке текст (перебор вариантов!)
для каждой кодировки нужен свой шрифт (изображения символов)

Слайд 8

Стандарт UNICODE

1 112 064 знаков, используются около 100 000

Windows: UTF-16

16 битов на

Стандарт UNICODE 1 112 064 знаков, используются около 100 000 Windows: UTF-16
распространённые символы,
32 бита на редко встречающиеся

Linux: UTF-8

8 битов на символ для ASCII,
от 16 до 48 бита на остальные

совместимость с ASCII
более экономична, чем UTF-16, если много символов ASCII

Слайд 9

Решение задач

Основные формулы:
Задача 1.
Текст длиной 32768 символов закодирован с помощью алфавита, содержащего

Решение задач Основные формулы: Задача 1. Текст длиной 32768 символов закодирован с
64 символа. Сколько килобайт занимает в памяти этот текст?
Задача 2.
Сообщение длиной 28672 символа занимает в памяти 21 Кбайт. Найдите мощность алфавита, который использовался при кодировании.

Слайд 10

Решение задач

Основные формулы:
Задача 2.
Сообщение длиной 28672 символа занимает в памяти 21 Кбайт.

Решение задач Основные формулы: Задача 2. Сообщение длиной 28672 символа занимает в
Найдите мощность алфавита, который использовался при кодировании.

Слайд 11

Кодирование графической информации

Кодирование графической информации

Слайд 12

Растровое кодирование

Пиксель – это наименьший элемент рисунка, для которого можно задать свой

Растровое кодирование Пиксель – это наименьший элемент рисунка, для которого можно задать
цвет.

дискретизация

пиксель

Растровое изображение – это изображение, которое кодируется как множество пикселей.

растр

Слайд 13

Растровое кодирование

1A2642FF425A5A7E16

Двоичный код
Шестнадцатиричный код

Первый символ Второй символ
шестнадцатеричного кода

Растровое кодирование 1A2642FF425A5A7E16 Двоичный код Шестнадцатиричный код Первый символ Второй символ шестнадцатеричного кода

Слайд 14

Соответствие 10, 2 и 16 кодов

Соответствие 10, 2 и 16 кодов

Слайд 15

Разрешение

Разрешение – это количество пикселей, приходящихся на дюйм размера изображения.

ppi = pixels

Разрешение Разрешение – это количество пикселей, приходящихся на дюйм размера изображения. ppi
per inch, пикселей на дюйм

300 ppi

96 ppi

48 ppi

24 ppi

печать

экран

1 дюйм = 2,54 см

Слайд 16

Разрешение

Задача 1. Какой размер в пикселях должен иметь закодированный рисунок с разрешением

Разрешение Задача 1. Какой размер в пикселях должен иметь закодированный рисунок с
300 ppi, чтобы с него можно было сделать отпечаток размером 10×15 см?

≈ 1181 пиксель

Задача 2. Закодированный рисунок имеет размеры 5760 × 3840 пикселей и разрешение 600 ppi. Какой размер будет у изображения, отпечатанного на принтере?

Слайд 17

Кодирование цвета. Теория цвета Юнга-Гельмгольца

Кодирование цвета. Теория цвета Юнга-Гельмгольца

Слайд 18

Цветовая модель RGB

(0, 0, 0)

(255, 255, 255)

(255, 0, 0)

(0, 255, 0)

(255, 255,

Цветовая модель RGB (0, 0, 0) (255, 255, 255) (255, 0, 0)
0)

(0, 0, 255)

(255, 150, 150)

(100, 0, 0)

256·256·256 = 16 777 216 (True Color, «истинный цвет»)

Слайд 19

Цветовая модель RGB

(255, 255, 0) → #FFFF00

Цветовая модель RGB (255, 255, 0) → #FFFF00

Слайд 20

Глубина цвета

R G B: 24 бита = 3 байта

R (0..255)

256 =

Глубина цвета R G B: 24 бита = 3 байта R (0..255)
28 вариантов

8 битов = 1 байт

Глубина цвета — это количество битов, используемое для кодирования цвета пикселя.

True Color (истинный цвет)

Задача. Определите размер файла, в котором закодирован растровый рисунок размером 20×30 пикселей в режиме истинного цвета (True Color)?
Основная формула I = i* m * n, где I – размер файла в битах, i – битовая глубина цвета, m * n – размер изображения в пикселях

20 ⋅ 30 ⋅ 3 байта = 1800 байт

Слайд 21

Растровые рисунки: форматы файлов

Растровые рисунки: форматы файлов

Слайд 22

Кодирование цвета при печати (CMYK)

Белый – красный = голубой C = Cyan
Белый –

Кодирование цвета при печати (CMYK) Белый – красный = голубой C =
зелёный = пурпурный M = Magenta
Белый – синий = желтый Y = Yellow

Модель CMY

C

M

Y

0

0

0

255

255

0

255

0

255

0

255

255

255

255

255

Модель CMYK: + Key color

меньший расход краски и лучшее качество для чёрного и серого цветов

Слайд 23

Цветовая модель HSB (HSV)

HSB = Hue (тон, оттенок) Saturation (насыщенность)
Brightness (яркость)

Цветовая модель HSB (HSV) HSB = Hue (тон, оттенок) Saturation (насыщенность) Brightness
или Value (величина)

Тон (H)

↓ насыщенность – добавить белого

↓ яркость – добавить чёрного

Слайд 24

Цветовая модель Lab

Международный стандарт кодирования цвета, независимого от устройства (1976 г.)
Основана на

Цветовая модель Lab Международный стандарт кодирования цвета, независимого от устройства (1976 г.)
модели восприятия цвета человеком.

Lab = Lightness (светлота)
a, b (задают цветовой тон)

Светлота 75%

Светлота 25%

для перевода между цветовыми моделями: RGB → Lab → CMYK
для цветокоррекции фотографий

Слайд 25

Растровое кодирование: итоги

универсальный метод (можно закодировать любое изображение)
единственный метод для кодирования и

Растровое кодирование: итоги универсальный метод (можно закодировать любое изображение) единственный метод для
обработки размытых изображений, не имеющих чётких границ (фотографий)

есть потеря информации (почему?)
при изменении размеров цвет и форма объектов на рисунке искажается
размер файла не зависит от сложности рисунка (а от чего зависит?)

Слайд 26

Решение задач

Задача 1. В процессе преобразования растрового графического файла количество цветов уменьшилось

Решение задач Задача 1. В процессе преобразования растрового графического файла количество цветов
с 512 до 8. Во сколько раз уменьшился информационный объем файла?
Задача 2. Для хранения растрового изображения размером 128 x 128 пикселей отвели 4 килобайта памяти. Каково максимально возможное число цветов в палитре изображения?

Слайд 27

Векторное кодирование

Рисунки из геометрических фигур:
отрезки, ломаные, прямоугольники
окружности, эллипсы, дуги
сглаженные линии (кривые Безье)
Для

Векторное кодирование Рисунки из геометрических фигур: отрезки, ломаные, прямоугольники окружности, эллипсы, дуги
каждой фигуры в памяти хранятся:
размеры и координаты на рисунке
цвет и стиль границы
цвет и стиль заливки (для замкнутых фигур)

Слайд 28

Векторное кодирование (итоги)

лучший способ для хранения чертежей, схем, карт
при кодировании нет потери

Векторное кодирование (итоги) лучший способ для хранения чертежей, схем, карт при кодировании
информации
при изменении размера нет искажений
меньше размер файла, зависит от сложности рисунка

неэффективно использовать для фотографий и размытых изображений

Слайд 29

Векторное кодирование: форматы файлов

WMF (Windows Metafile)
EMF (Windows Metafile)
CDR (программа CorelDraw)
AI (программа Adobe

Векторное кодирование: форматы файлов WMF (Windows Metafile) EMF (Windows Metafile) CDR (программа
Illustrator)
SVG (Scalable Vector Graphics, масштабируемые векторные изображения)

для веб-страниц

Слайд 30

Практическая работа №4 Кодирование текстовой и графической информации

Задание 1.
Используя шифр Цезаря с

Практическая работа №4 Кодирование текстовой и графической информации Задание 1. Используя шифр
шагом 3,закодировать сообщение УТРО ВЕЧЕРА МУДРЕНЕЕ
Шифр Цезаря. Способ кодировки, при котором буква заменяется на другую букву, отстоящую от первой на определенный шаг.
Например, если шаг равен 3, то буква А меняется на Г, буква Б – на Д, а буква Ю – на букву Б.
Оформление задания

Задание 2.
Для кодирования сообщения используется таблица
Приведите все варианта декодирования сообщения 0101110010110.
Ответ оформить в виде последовательности букв. Например, АГДБВ

Задание 3.
Текст длиной 73728 символов закодирован с помощью алфавита, содержащего 8 символов. Сколько килобайт занимает в памяти этот текст?