Лекция: Вывод: чем больше возможных событий, тем больше начальная неопределенность результата и, главное, тем больше количество информации будет получено после проведения опыта.

§ Семантический подход— количество полученной информации измеряется с учётом её смысла для получателя. Оценивается количество смысла полученной информации, с помощью сравнения объёмов тезаурусов до и после получения информации, т.е. оно равно разности тезауруса Sп до получения информации Sп.0 и после получения информации Sп.1, т.е. I=Sп.1Sп.0 .

Определение. Тезаурус— свод слов, устойчивых словосочетаний, описывающих предметную область, сгруппированных и упорядоченных по некоторым правилам (например, в порядке убывания алфавита).

§ Прагматический подход— количество информации в данном случае оценивается как полезность сообщения. Для этого используется следующее соотношение I= log2 (P1/P0), где P — вероятность решения задачи: P0 до получения сообщения и P1 после получения сообщения.

Определение. Вероятность— величина, которая может принимать значения в диапазоне от 0 до 1. Она может рассматриваться как мера возможности наступления какого-либо события, которое может иметь место в одних случаях и не иметь места в других.

Получение информации — это, в конечном счете, получение фактов, сведений и данных о свойствах, структуре или взаимодействии объектов и явлений окружающего нас мира с использованием некоторой абстрактной системы символов (жестов, знаков, рисунков и прочее) для представления содержательной информации.

В процессе развития человеческого общества люди выработали большое число подобных систем — языков. Среди них — язык жестов и мимики, язык рисунков и чертежей, язык музыки, разговорные языки и т.д.

Пример: Язык жестов — морской флажковый семафор. Язык музыки — ноты. Языки программирования — Visual Basic, Pascal, Perl, C.

Основой большинства языков является алфавит. Алфавит — это набор символов, из которых можно составить слова и фразы данного языка.

Пример:

§ Латинский алфавит (прописные буквы): A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z.

§ Русский алфавит (прописные буквы): А, Б, В, Г, Д, Е, Ё, Ж, З, И, Й, К, Л, М, Н, О, П, Р, С, Т, У, Ф, Х, Ц, Ч, Ш, Щ, Ъ, Ы, Ь, Э, Ю, Я.

§ Алфавит десятичных цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.

§ Алфавит двоичных цифр: 0, 1.

Примечание.

Простота двоичного алфавита обеспечила его широкое применение в вычислительной технике. Значения 0 и 1 в компьютерах представляются физическими состояниями “намагничено — не намагничено”, “есть напряжение — нет напряжения”.

Одним из самых распространенных способов представления информации является естественный (разговорный или письменный) язык. Люди обмениваются устными сообщениями, записками, посланиями. Они передают друг другу просьбы, приказы, отчеты о проделанной работе, описи имущества; публикуют рекламные объявления и научные статьи, хранят старые письма и документы. Одним из самых простых способов получения интересующей нас информации у собеседника состоит в задании ему вопросов, которые предполагают ответ, имеющий только два значения — “Да” или “Нет”.

Пример: Задаем человеку такой вопрос: «Вы сегодня обедали?». С одинаковой вероятностью следует ожидать ответ «Да» или «Нет».

 

Примечание.

Обозначить ответы «Да» и «Нет» можно не только словами, но и любым другим образом. Можно было бы взять буквы А и Е, либо цифры 3 и 7. Однако, для простоты записи обычно применяются символы двоичного алфавита 1 и 0.

Определение. Количество информации, которое можно получить при ответе типа «да-нет» на какой-либо вопрос, называется битом (bit — аббревиатура от binary digit — двоичная единица), причем бит — минимальная единица количества информации, ибо получить информацию, меньшую, чем 1 бит, невозможно.

Примечание.

Одно из главных понятий XX века — бит впервые было введено американским ученым-статистиком Джоном Тьюки в 1946 году.

еще рефераты
Еще работы по информатике