Лекция: Алфавитный подход к измерению информации
Алфавитный подход основан на том, что всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита.
Алфавит — упорядоченный набор символов, используемый для кодирования сообщений на некотором языке.
Мощность алфавита — количество символов алфавита.
Двоичный алфавит содержит 2 символа, его мощность равна двум.
Сообщения, записанные с помощью символов ASCII, используют алфавит из 256 символов. Сообщения, записанные по системе UNICODE, используют алфавит из 65 536 символов.
Чтобы определить объем информации в сообщении при алфавитном подходе, нужно последовательно решить задачи:
1. Определить количество информации (i) в одном символе по формуле 2i = N, где N — мощность алфавита
2. Определить количество символов в сообщении (m)
3. Вычислить объем информации по формуле: I = i * K.
Количество информации во всем тексте (I), состоящем из K символов, равно произведению информационного веса символа на К:
I = i * К.
Эта величина является информационным объемом текста.
Например, если текстовое сообщение, закодированное по системе ASCII, содержит 100 символов, то его информационный объем составляет 800 бит.
2i = 256 I = 8
I = 8 * 100 = 800
Для двоичного сообщения той же длины информационный объем составляет 100 бит.
Необходимо так же знать единицы измерения информации и соотношения между ними.