Кодирование текстовой информации

Содержание

Слайд 2

Двоичное кодирование текстовой информации

В 40-е годы прошлого столетия было положено начало созданию

Двоичное кодирование текстовой информации В 40-е годы прошлого столетия было положено начало
вычислительной машины.
Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.

Слайд 3

Таинственные знаки
+|| ++|||| +++|||
12 24 33

Таинственные знаки +|| ++|||| +++||| 12 24 33

Слайд 4

Двоичное кодирование текстовой информации

В памяти компьютера любой текст представляется последовательностью кодов символов,

Двоичное кодирование текстовой информации В памяти компьютера любой текст представляется последовательностью кодов
т. е. вместо самой буквы хранится ее номер в кодовой таблице. Изображение же букв и символов сформируется только в момент их вывода на экран или бумагу.

Слайд 5

Двоичное кодирование текстовой информации

Кодирование заключается в том, что каждому символу ставиться в

Двоичное кодирование текстовой информации Кодирование заключается в том, что каждому символу ставиться
соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).

Слайд 6

Кодовые таблицы

Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое

Кодовые таблицы Важно, что присвоение символу конкретного кода – это вопрос соглашения,
фиксируется кодовой таблицей.
Для разных типов ЭВМ используются различные кодировки

Слайд 7

Кодовые таблицы

По началу применялось 7-битная кодировка, которая могла представить 128 символов. С

Кодовые таблицы По началу применялось 7-битная кодировка, которая могла представить 128 символов.
распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standart Code for Information Interchange) – Американский стандартный код для информационного обмена.

Слайд 8

Таблица кодировки ASCII

Позже она была расширена до 8 бит (256 символов) и

Таблица кодировки ASCII Позже она была расширена до 8 бит (256 символов)
дошла в таком виде практически до сегодняшнего дня. При этом первая половина (символы 0-127) были всегда одни и те же, соответствующие стандарту ASCII, а вторая половина таблицы (символы 128-255) менялась в зависимости от страны, где она использовалась.

Слайд 9

Стандартная часть таблицы

Стандартная часть таблицы

Слайд 10

Таблица расширенного кода ASCII Кодировка Windows-1251 (CP1251)

Таблица расширенного кода ASCII Кодировка Windows-1251 (CP1251)

Слайд 11

Кодовые таблицы

В Советском Союзе различные организации и сети, имевшие большое влияние на

Кодовые таблицы В Советском Союзе различные организации и сети, имевшие большое влияние
компьютерный и программный рынок тех времен, создавали свои кодировки (т.е. вторые половины таблицы), содержащие русские символы.

Слайд 12

Кодовые таблицы для русских букв

В настоящее время существует 5 разных кодовых таблиц

Кодовые таблицы для русских букв В настоящее время существует 5 разных кодовых
для русских букв (КОИ8, СР1251, СР866, Mac, ISO).
Широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536 ) различных символов.

Слайд 13

Проблемы с кодировками

Проблемы с кодировками делятся на несколько типов. Первый тип -

Проблемы с кодировками Проблемы с кодировками делятся на несколько типов. Первый тип
это отсутствие информации о кодировке.

Слайд 14

Проблемы с кодировками

Проблемы второго типа - это когда кодировка в файле указана,

Проблемы с кодировками Проблемы второго типа - это когда кодировка в файле
но конечная программа такой кодировки не знает.

Слайд 15

Проблемы с кодировками

Третий тип проблем, наоборот, связан с избытком информации о

Проблемы с кодировками Третий тип проблем, наоборот, связан с избытком информации о
кодировках. Это актуальная в настоящее время проблема (например, для веб-страниц).

Слайд 16

Обратите внимание!

Цифры кодируются по стандарту ASCII в двух случаях – при

Обратите внимание! Цифры кодируются по стандарту ASCII в двух случаях – при
вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичных код.

Слайд 17

Обратите внимание!

Возьмем число 57.
При использовании в тексте каждая цифра будет

Обратите внимание! Возьмем число 57. При использовании в тексте каждая цифра будет
представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе это – 0011010100110111.
При использовании в вычислениях, код этого числа будет получен по правилам перевода в двоичную систему и получим – 00111001.

Слайд 18

Информационный объем текста

Сегодня очень многие люди для подготовки писем, документов, статей, книг

Информационный объем текста Сегодня очень многие люди для подготовки писем, документов, статей,
и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов.
В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.

Слайд 19

Формулы для расчета информационного объема текста

I=K×i, где
I-информационный объем сообщения
K- количество символов в

Формулы для расчета информационного объема текста I=K×i, где I-информационный объем сообщения K-
тексте
i- информационный вес одного символа
2i = N
N- мощность алфавита

Слайд 20

Задание 1

Мощность алфавита равна 256. Сколько Кбайт памяти потребуется для сохранения 160

Задание 1 Мощность алфавита равна 256. Сколько Кбайт памяти потребуется для сохранения
страниц текста, содержащего в среднем 192 символа на каждой странице?

Слайд 21

Задание 1’

Мощность алфавита равна 64. Сколько Кбайт памяти потребуется, чтобы сохранить 128

Задание 1’ Мощность алфавита равна 64. Сколько Кбайт памяти потребуется, чтобы сохранить
страниц текста, содержащего в среднем 256 символов на каждой странице?

Слайд 22

Задание 2

Объем сообщения – 7,5 Кбайт. Известно, что данное сообщение содержит 7680

Задание 2 Объем сообщения – 7,5 Кбайт. Известно, что данное сообщение содержит
символов. Какова мощность алфавита?

Слайд 23

Задание 2’

Объем сообщения равен 11 Кбайт. Сообщение содержит 11264 символа. Какова мощность

Задание 2’ Объем сообщения равен 11 Кбайт. Сообщение содержит 11264 символа. Какова мощность алфавита?
алфавита?

Слайд 24

Задание 3

Племя Мумбу-Юмбу использует алфавит из букв: α β γ δ ε

Задание 3 Племя Мумбу-Юмбу использует алфавит из букв: α β γ δ
ζ η θ λ μ ξ σ φ ψ, точки и для разделения слов используется пробел.
Сколько информации несет свод законов племени, если в нем 12 строк и в каждой строке по 20 символов?

Слайд 25

Задание 3’

Для кодирования секретного сообщения используются 12 специальных значков-символов. При этом символы

Задание 3’ Для кодирования секретного сообщения используются 12 специальных значков-символов. При этом
кодируются одним и тем же минимально возможным количеством бит. Чему равен информационный объем сообщения длиной в 256 символов?

Слайд 26

Вопросы и задания:

В чем заключается кодирование текстовой информации в компьютере?
Закодируйте с помощью

Вопросы и задания: В чем заключается кодирование текстовой информации в компьютере? Закодируйте
ASCII-кода свою фамилию, имя, номер класса.
Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа!
Имя файла: Кодирование-текстовой-информации.pptx
Количество просмотров: 124
Количество скачиваний: 0