Слайд 2Технологии обработки текстовой информации. Кодовые таблицы
Текстовая информация – это информация, представленная в

виде букв, знаков препинания и специальных символов некоторой знаковой системы. Буквы и другие знаки принято называть символами. Набор их конечен. Текстовую информацию иногда называют символьной. Знаковая система содержит еще и правила выполнения операций над знаками (грамматика, синтаксис).
Кодирование – это процесс представления каждого символа в виде кода.
Код – набор условных обозначений для представления информации.
Количество знаков в коде называется длиной кода.
Слайд 3Естественные языки – это знаковые системы с исключениями из правил. Поэтому их

нельзя использовать для кодирования информации с последующей обработкой на компьютере. Знаковые системы со строгими правилами называются формальными.
Для компьютерного кодирования информации используется формальная двоичная знаковая система. Физическая природа знаков двоичного компьютерного кода – это электрические импульсы (наличие импульса или его отсутствие). При кодировании используется кодировочная таблица. Таблица устанавливает взаимно однозначное соответствие между знаками и их кодами.
Слайд 6Кодирование текстовой информации
Декодирование – процесс обратный кодированию, т.е. код символа преобразуется в

его изображение. Процесс декодирования информации осуществляется при выводе информации из оперативной памяти компьютера на экран монитора, например, или на листинг с помощью принтера.
Слайд 11Таблицы кодировки русскоязычных символов

Слайд 12Таблицы кодировки русскоязычных символов

Слайд 13Таблицы кодировки русскоязычных символов

Слайд 14Таблицы кодировки русскоязычных символов

Слайд 15Кодовая таблица ASCII
Для разных типов ЭВМ используются различные таблицы кодировки.
С распространением

персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standard Code for Information Interchange) – американский стандартный код для информационного обмена
Слайд 16Этот формат оперирует с 256 численными кодами, имеющими значения от 0 до

255. В соответствие каждому коду ставится определенный символ (буква, цифра, знак препинания, математический символ или символ псевдографики). Это соответствие задается с помощью стандартных кодовых таблиц с различными номерами (например, таблица 866 предназначена для русскоязычных пользователей). Не содержит форматирования текста, поэтому является переносимым между различными операционными системами и программами.
Слайд 17ANSI (American National Standard Interface) кодировка в среде Windows. У этих кодировок

совпадают те части, которые относятся к латинскому алфавиту, специальным символам, цифрам, знакам препинания и математическим операциям, а различаются относящиеся к другим алфавитам и псевдографике