Urok_14_PR4_Predstavlenie_texta

Март 16, 2021

Главная
Информатика
Urok_14_PR4_Predstavlenie_texta

Содержание

2. Представление данных и программ в компьютере Итак, чтобы компьютер мог воспринять и обработать числовые значения, текст,
3. в памяти – ? Кодирование текста на экране – символы двоичные коды
4. Вспомним n – информационный вес символа – количество бит в двоичном коде. N – мощность алфавита
5. Кодовые таблицы Для представления текстовых данных в компьютерах используют так называемые кодовые таблицы – наборы кодов
6. Кодовая таблица ASCII ASCII (англ. American standard code for information interchange, [’æs.ki]) — самая популярная кодовая
7. Первая половина таблицы ASCII
8. Вторая половина таблицы ASCII
9. Проблема ASCII Исторически сложилось, что в 8-битовых кодировках ASCII первую половину кодовой таблицы (0—127) занимают всегда
10. Кириллица в ASCII К сожалению, в настоящее время существуют много различных кодовых таблиц для кириллицы в
11. Разные кодировки кириллицы Одним из первых стандартов кодирования русских букв был КОИ8 ("Код обмена информацией, 8-битный").
12. Unicode С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется
13. Развитие Unicode И 65 536 символов становится недостаточно. Консорциум Unicode, который разрабатывает стандарт Unicode, реализовал кодировки
14. Различные кодировки Unicode Unicode – это теперь не кодировка, а набор символов, которым ведает всемирная организация
15. UTF-8 UTF-8 (от англ. Unicode Transformation Format — «формат преобразования Юникода, 8-битный») — одна из общепринятых
16. UTF-16 UTF-16 (от англ. Unicode Transformation Format — «формат преобразования Юникода, 16-битный») — это кодировка символов
17. Задание 1. Скачайте и откройте файл ПР4.xlsx. 3. Напишите в файле свои Фамилия, Имя и Отчество
19. Скачать презентацию

Представление данных и программ в компьютере
Итак, чтобы компьютер мог воспринять и обработать

числовые значения, текст, изображение, звук или видео, их нужно представить в виде последовательностей 0 и 1

кодирование

10101001010

данные (код)

обработка

11111100010

данные (код)

хранение

передача

в памяти – ?
Кодирование текста
на экране – символы
двоичные коды

Вспомним
n – информационный вес символа – количество бит в двоичном коде.
N –

мощность алфавита – количество всех символов алфавита (кодовых комбинаций).

N=2n

Если с помощью n-разрядного двоичного кода закодировать алфавит, то количество символов этого алфавита составит

Кодовые таблицы
Для представления текстовых данных в компьютерах используют так называемые кодовые таблицы

– наборы кодов для кодирования определенного количества символов, где каждому из символов соответствует двоичный код определенной длины.

Кодовая таблица ASCII
ASCII (англ. American standard code for information interchange, [’æs.ki]) —

самая популярная кодовая таблица, была разработана и стандартизована в США в 1963 году. Название «ASCII» по-русски часто произносится как [аски].
Информационный вес символа в коде ASCII – 8 бит. Мощность алфавита при этом составляет 256 символов (28).

Слайд 7

Первая половина таблицы ASCII

Слайд 8

Вторая половина таблицы ASCII

Слайд 9

Проблема ASCII
Исторически сложилось, что в 8-битовых кодировках ASCII первую половину кодовой таблицы

(0—127) занимают всегда «американские» символы, а вторую (128—255) — дополнительные символы, включая набор букв национальных языков и местных символов.
Отсутствие единого стандарта размещения кириллических символов в таблице ASCII доставляло (и доставляет) множество проблем с кодировками (КОИ-8, Windows-1251 и др.).
Позже кодовые таблицы стандартизировали. Просто стандартизировали их названия и наборы символов. Но проблема осталась!

Слайд 10

Кириллица в ASCII
К сожалению, в настоящее время существуют много различных кодовых таблиц

для кириллицы в ASCII. Наиболее распространены КОИ8-R, CP1251, CP866, Mac и ISO. Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.

Слайд 11

Разные кодировки кириллицы
Одним из первых стандартов кодирования русских букв был КОИ8 ("Код

обмена информацией, 8-битный"). Кодировка применялась ещё в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х годов стала использоваться в первых русифицированных версиях ОС UNIX. В дальнейшем используется «потомками» ОС Unix: Linux, Android.
От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866. Используется в командном языке и в консольном режиме ОС Windows.
Наиболее распространенной в настоящее время является кодировка Microsoft, обозначаемая сокращением CP1251. Является стандартной 8-битной кодировкой для русских версий ОС Windows.
Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.
Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5. Широко применяется в Сербии, Болгарии на юниксоподобных системах. У нас не популярна!

Слайд 12

Unicode
С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного

стандарта, который называется Unicode. Первоначально это была 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов.
Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Слайд 13

Развитие Unicode
И 65 536 символов становится недостаточно.
Консорциум Unicode, который разрабатывает стандарт

Unicode, реализовал кодировки с переменной длиной двоичного кода символов.
Такие кодировки позволяют наращивать длину двоичного кода. Сегодня в Юникоде уже больше 140 тыс. символов.
Наиболее часто используемые кодировки Юникода – UTF-8 и UTF-16.

Слайд 14

Различные кодировки Unicode
Unicode – это теперь не кодировка, а набор символов, которым

ведает всемирная организация – консорциум Unicode.
UTF-8 и UTF-16 – это кодировки.
Кодировка – это способ и алгоритм записи символов в двоичным кодом.
Кодировка UTF-8 сохранит "hello", например, как: 01101000 01100101 01101100 01101100 01101111
или лучше это записать шестнадцатеричным кодом:
68 65 6C 6C 6F

Все кодировки Юникода могут кодировать одни и те же символы, тексты могут быть переведены из одной кодировки Юникода в другую без потери данных.

Слайд 15

UTF-8
UTF-8 (от англ. Unicode Transformation Format — «формат преобразования Юникода, 8-битный») —

одна из общепринятых и стандартизированных кодировок текста, которая позволяет хранить символы Юникода, используя переменное количество байт (от 1 до 6).
Коды символов первой половины кода ASCII совпадают с кодами UTF-8. Коды остальных символов содержат от 2 до 6 байт. Русские буквы – по 2 байта.
UTF-8 является самой предпочтительной кодировкой для электронной почты и веб-страниц.

Слайд 16

UTF-16
UTF-16 (от англ. Unicode Transformation Format — «формат преобразования Юникода, 16-битный») —

это кодировка символов переменной длины для Unicode, способная кодировать весь набор Unicode. Наименьшая длина кода символа в этой кодировке – 16 бит.
UTF-16 используется в основных операционных системах и средах, таких как Microsoft Windows, Java и .NET.

Слайд 17

Задание
1. Скачайте и откройте файл ПР4.xlsx.
3. Напишите в файле свои Фамилия, Имя

и Отчество (первые буквы заглавные, между словами по одному пробелу). Например: Путин Владимир Владимирович
4. Запишите шестнадцатеричное представление данного текста в коде АSCII (кодировка CP1251).
Можно воспользоваться таблицей символов в текстовом процессоре Word. Во вкладке Вставка откройте окно Символ. Найдите символы кириллицы и их шестнадцатеричные коды ASCII.
Можно воспользоваться готовой таблицей из какого-нибудь учебника или справочника, найти в сети Интернет (или такой, которая имеется в папке урока).
5. Закройте файл с сохранением.
6. Отправьте файл учителю.

Urok_14_PR4_Predstavlenie_texta

Содержание

Слайд 2

Представление данных и программ в компьютере
Итак, чтобы компьютер мог воспринять и обработать

Слайд 3

в памяти – ?
Кодирование текста
на экране – символы
двоичные коды

Слайд 4

Вспомним
n – информационный вес символа – количество бит в двоичном коде.
N –

Слайд 5

Кодовые таблицы
Для представления текстовых данных в компьютерах используют так называемые кодовые таблицы

Слайд 6

Кодовая таблица ASCII
ASCII (англ. American standard code for information interchange, [’æs.ki]) —

Слайд 7

Первая половина таблицы ASCII

Слайд 8

Вторая половина таблицы ASCII

Слайд 9

Проблема ASCII
Исторически сложилось, что в 8-битовых кодировках ASCII первую половину кодовой таблицы

Слайд 10

Кириллица в ASCII
К сожалению, в настоящее время существуют много различных кодовых таблиц

Слайд 11

Разные кодировки кириллицы
Одним из первых стандартов кодирования русских букв был КОИ8 ("Код

Слайд 12

Unicode
С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного

Слайд 13

Развитие Unicode
И 65 536 символов становится недостаточно.
Консорциум Unicode, который разрабатывает стандарт

Слайд 14

Различные кодировки Unicode
Unicode – это теперь не кодировка, а набор символов, которым

Слайд 15

UTF-8
UTF-8 (от англ. Unicode Transformation Format — «формат преобразования Юникода, 8-битный») —

Слайд 16

UTF-16
UTF-16 (от англ. Unicode Transformation Format — «формат преобразования Юникода, 16-битный») —

Слайд 17

Задание
1. Скачайте и откройте файл ПР4.xlsx.
3. Напишите в файле свои Фамилия, Имя

Urok_14_PR4_Predstavlenie_texta

Содержание

Представление данных и программ в компьютереИтак, чтобы компьютер мог воспринять и обработать

в памяти – ?Кодирование текстана экране – символыдвоичные коды

Вспомнимn – информационный вес символа – количество бит в двоичном коде.N –

Кодовые таблицыДля представления текстовых данных в компьютерах используют так называемые кодовые таблицы

Кодовая таблица ASCIIASCII (англ. American standard code for information interchange, [’æs.ki]) —

Первая половина таблицы ASCII

Вторая половина таблицы ASCII

Проблема ASCIIИсторически сложилось, что в 8-битовых кодировках ASCII первую половину кодовой таблицы

Кириллица в ASCIIК сожалению, в настоящее время существуют много различных кодовых таблиц

Разные кодировки кириллицыОдним из первых стандартов кодирования русских букв был КОИ8 ("Код

UnicodeС конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного

Развитие UnicodeИ 65 536 символов становится недостаточно. Консорциум Unicode, который разрабатывает стандарт

Различные кодировки UnicodeUnicode – это теперь не кодировка, а набор символов, которым

UTF-8UTF-8 (от англ. Unicode Transformation Format — «формат преобразования Юникода, 8-битный») —

UTF-16UTF-16 (от англ. Unicode Transformation Format — «формат преобразования Юникода, 16-битный») —

Задание1. Скачайте и откройте файл ПР4.xlsx.3. Напишите в файле свои Фамилия, Имя

Похожие презентации

Представление данных и программ в компьютере
Итак, чтобы компьютер мог воспринять и обработать

в памяти – ?
Кодирование текста
на экране – символы
двоичные коды

Вспомним
n – информационный вес символа – количество бит в двоичном коде.
N –

Кодовые таблицы
Для представления текстовых данных в компьютерах используют так называемые кодовые таблицы

Кодовая таблица ASCII
ASCII (англ. American standard code for information interchange, [’æs.ki]) —

Проблема ASCII
Исторически сложилось, что в 8-битовых кодировках ASCII первую половину кодовой таблицы

Кириллица в ASCII
К сожалению, в настоящее время существуют много различных кодовых таблиц

Разные кодировки кириллицы
Одним из первых стандартов кодирования русских букв был КОИ8 ("Код

Unicode
С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного

Развитие Unicode
И 65 536 символов становится недостаточно.
Консорциум Unicode, который разрабатывает стандарт

Различные кодировки Unicode
Unicode – это теперь не кодировка, а набор символов, которым

UTF-8
UTF-8 (от англ. Unicode Transformation Format — «формат преобразования Юникода, 8-битный») —

UTF-16
UTF-16 (от англ. Unicode Transformation Format — «формат преобразования Юникода, 16-битный») —

Задание
1. Скачайте и откройте файл ПР4.xlsx.
3. Напишите в файле свои Фамилия, Имя