ec348dc740ecdcff55791b0cb87be4c8
Алфавитный (объёмный) подход к измерению информации Алфавитный (объёмный) подход к измерению информации позволяет определить количество информации, заключенной в тексте, записанном с помощью некоторого алфавита. Алфавит – множество используемых символов в языке. Обычно под алфавитом понимают не только буквы, но и цифры, знаки препинания и пробел. Мощность алфавита (N) – количество символов, используемых в алфавите. Например, мощность алфавита из русских букв равна 32 (буква ё обычно не используется). Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ, вычисляется по формуле Хартли: i=log2N N– мощность алфавита. Задает связь между количеством возможных событий N и количеством информации: N=2^i Из базового курса информатики известно, что в компьютерах используется двоичное кодирование информации. Для двоичного представления текстов в компьютере чаще всего используется равномерный восьмиразрядный код. С его помощью можно закодировать алфавит из 256 символов, поскольку 256=28. В стандартную кодовую таблицу (например, ASCII) помещаются все необходимые символы: английские и русские прописные и строчные буквы, цифры, знаки препинания, знаки арифметических операций, всевозможные скобки и пр. В двоичном коде один двоичный разряд несет одну единицу информации, которая называется 1 бит. Например, в 2-символьном алфавите каждый символ «весит» 1 бит (log22=1); в 4-символьном алфавите каждый символ несет 2 бита информации (log2=2); в 8-символьном – 3 бита (log28=3) и т. д. Один символ из алфавита мощностью 256 ( 28) несет в тексте 8 битов информации. Такое количество информации называется байтом. 1 байт =8 битов Информационный объем текста в памяти компьютера измеряется в байтах. Он равен количеству знаков в записи текста.