Кодирование текстовой информации

Содержание

Слайд 2

В традиционных кодировках для кодирования одного символа используется 8 бит. Легко подсчитать

В традиционных кодировках для кодирования одного символа используется 8 бит. Легко подсчитать
, что такой 8-разрядный код позволяет закодировать 256 различных символов.
Присвоение символу определенного числового кода – это вопрос соглашения.

Слайд 3

В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for

В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for
Information Interchange), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам).

Слайд 4

Кодовая таблица ASCII

Кодовая таблица ASCII

Слайд 5

Во второй половине содержатся коды национальных алфавитов, символы псевдографики и некоторые математические

Во второй половине содержатся коды национальных алфавитов, символы псевдографики и некоторые математические
знаки. К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO), что вызывает дополнительные трудности при работе с русскоязычными документами.

Слайд 6

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8
.
Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.

Слайд 7

КОИ8 («Код обмена информацией, 8-битный»)

КОИ8 («Код обмена информацией, 8-битный»)

Слайд 8

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251
("CP" означает "Code Page", "кодовая страница").

Слайд 9

От начала 90-ых годов, времени господства операционной системы MS DOS, остается кодировка

От начала 90-ых годов, времени господства операционной системы MS DOS, остается кодировка CP866.
CP866.

Слайд 10

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.
собственную кодировку Mac.

Слайд 11

Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта

Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта
для русского языка еще одну кодировку под названием ISO 8859-5.

Слайд 12

Unicode

В конце 90-ых годов появился новый международный стандарт Unicode, который отводит под

Unicode В конце 90-ых годов появился новый международный стандарт Unicode, который отводит
один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Слайд 13

Пример

Представьте в форме шестнадцатеричного кода слово «ЭВМ».
CP1251: 221 194 204
CP866: 157 130 140 .
В

Пример Представьте в форме шестнадцатеричного кода слово «ЭВМ». CP1251: 221 194 204
16 с/с
CP1251: DD C2 CC
CP866: 9D 82 8C
Имя файла: Кодирование-текстовой-информации.pptx
Количество просмотров: 204
Количество скачиваний: 0