Слайд 2Двоичное кодирование текстовой информации
В 40-е годы прошлого столетия было положено начало созданию
![Двоичное кодирование текстовой информации В 40-е годы прошлого столетия было положено начало](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-1.jpg)
вычислительной машины.
Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.
Слайд 3Таинственные знаки
+|| ++|||| +++|||
12 24 33
![Таинственные знаки +|| ++|||| +++||| 12 24 33](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-2.jpg)
Слайд 4Двоичное кодирование текстовой информации
В памяти компьютера любой текст представляется последовательностью кодов символов,
![Двоичное кодирование текстовой информации В памяти компьютера любой текст представляется последовательностью кодов](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-3.jpg)
т. е. вместо самой буквы хранится ее номер в кодовой таблице. Изображение же букв и символов сформируется только в момент их вывода на экран или бумагу.
Слайд 5Двоичное кодирование текстовой информации
Кодирование заключается в том, что каждому символу ставиться в
![Двоичное кодирование текстовой информации Кодирование заключается в том, что каждому символу ставиться](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-4.jpg)
соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).
Слайд 6Кодовые таблицы
Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое
![Кодовые таблицы Важно, что присвоение символу конкретного кода – это вопрос соглашения,](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-5.jpg)
фиксируется кодовой таблицей.
Для разных типов ЭВМ используются различные кодировки
Слайд 7Кодовые таблицы
По началу применялось 7-битная кодировка, которая могла представить 128 символов. С
![Кодовые таблицы По началу применялось 7-битная кодировка, которая могла представить 128 символов.](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-6.jpg)
распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standart Code for Information Interchange) – Американский стандартный код для информационного обмена.
Слайд 8Таблица кодировки ASCII
Позже она была расширена до 8 бит (256 символов) и
![Таблица кодировки ASCII Позже она была расширена до 8 бит (256 символов)](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-7.jpg)
дошла в таком виде практически до сегодняшнего дня. При этом первая половина (символы 0-127) были всегда одни и те же, соответствующие стандарту ASCII, а вторая половина таблицы (символы 128-255) менялась в зависимости от страны, где она использовалась.
Слайд 10Таблица расширенного кода ASCII
Кодировка Windows-1251 (CP1251)
![Таблица расширенного кода ASCII Кодировка Windows-1251 (CP1251)](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-9.jpg)
Слайд 11Кодовые таблицы
В Советском Союзе различные организации и сети, имевшие большое влияние на
![Кодовые таблицы В Советском Союзе различные организации и сети, имевшие большое влияние](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-10.jpg)
компьютерный и программный рынок тех времен, создавали свои кодировки (т.е. вторые половины таблицы), содержащие русские символы.
Слайд 12Кодовые таблицы для русских букв
В настоящее время существует 5 разных кодовых таблиц
![Кодовые таблицы для русских букв В настоящее время существует 5 разных кодовых](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-11.jpg)
для русских букв (КОИ8, СР1251, СР866, Mac, ISO).
Широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536 ) различных символов.
Слайд 13Проблемы с кодировками
Проблемы с кодировками делятся на несколько типов. Первый тип -
![Проблемы с кодировками Проблемы с кодировками делятся на несколько типов. Первый тип](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-12.jpg)
это отсутствие информации о кодировке.
Слайд 14Проблемы с кодировками
Проблемы второго типа - это когда кодировка в файле указана,
![Проблемы с кодировками Проблемы второго типа - это когда кодировка в файле](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-13.jpg)
но конечная программа такой кодировки не знает.
Слайд 15Проблемы с кодировками
Третий тип проблем, наоборот, связан с избытком информации о
![Проблемы с кодировками Третий тип проблем, наоборот, связан с избытком информации о](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-14.jpg)
кодировках. Это актуальная в настоящее время проблема (например, для веб-страниц).
Слайд 16Обратите внимание!
Цифры кодируются по стандарту ASCII в двух случаях – при
![Обратите внимание! Цифры кодируются по стандарту ASCII в двух случаях – при](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-15.jpg)
вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичных код.
Слайд 17Обратите внимание!
Возьмем число 57.
При использовании в тексте каждая цифра будет
![Обратите внимание! Возьмем число 57. При использовании в тексте каждая цифра будет](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-16.jpg)
представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе это – 0011010100110111.
При использовании в вычислениях, код этого числа будет получен по правилам перевода в двоичную систему и получим – 00111001.
Слайд 18Информационный объем текста
Сегодня очень многие люди для подготовки писем, документов, статей, книг
![Информационный объем текста Сегодня очень многие люди для подготовки писем, документов, статей,](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-17.jpg)
и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов.
В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.
Слайд 19Формулы для расчета информационного объема текста
I=K×i, где
I-информационный объем сообщения
K- количество символов в
![Формулы для расчета информационного объема текста I=K×i, где I-информационный объем сообщения K-](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-18.jpg)
тексте
i- информационный вес одного символа
2i = N
N- мощность алфавита
Слайд 20Задание 1
Мощность алфавита равна 256. Сколько Кбайт памяти потребуется для сохранения 160
![Задание 1 Мощность алфавита равна 256. Сколько Кбайт памяти потребуется для сохранения](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-19.jpg)
страниц текста, содержащего в среднем 192 символа на каждой странице?
Слайд 21Задание 1’
Мощность алфавита равна 64. Сколько Кбайт памяти потребуется, чтобы сохранить 128
![Задание 1’ Мощность алфавита равна 64. Сколько Кбайт памяти потребуется, чтобы сохранить](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-20.jpg)
страниц текста, содержащего в среднем 256 символов на каждой странице?
Слайд 22Задание 2
Объем сообщения – 7,5 Кбайт. Известно, что данное сообщение содержит 7680
![Задание 2 Объем сообщения – 7,5 Кбайт. Известно, что данное сообщение содержит](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-21.jpg)
символов. Какова мощность алфавита?
Слайд 23Задание 2’
Объем сообщения равен 11 Кбайт. Сообщение содержит 11264 символа. Какова мощность
![Задание 2’ Объем сообщения равен 11 Кбайт. Сообщение содержит 11264 символа. Какова мощность алфавита?](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-22.jpg)
алфавита?
Слайд 24Задание 3
Племя Мумбу-Юмбу использует алфавит из букв: α β γ δ ε
![Задание 3 Племя Мумбу-Юмбу использует алфавит из букв: α β γ δ](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-23.jpg)
ζ η θ λ μ ξ σ φ ψ, точки и для разделения слов используется пробел.
Сколько информации несет свод законов племени, если в нем 12 строк и в каждой строке по 20 символов?
Слайд 25Задание 3’
Для кодирования секретного сообщения используются 12 специальных значков-символов. При этом символы
![Задание 3’ Для кодирования секретного сообщения используются 12 специальных значков-символов. При этом](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-24.jpg)
кодируются одним и тем же минимально возможным количеством бит. Чему равен информационный объем сообщения длиной в 256 символов?
Слайд 26Вопросы и задания:
В чем заключается кодирование текстовой информации в компьютере?
Закодируйте с помощью
![Вопросы и задания: В чем заключается кодирование текстовой информации в компьютере? Закодируйте](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/344066/slide-25.jpg)
ASCII-кода свою фамилию, имя, номер класса.
Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа!