Лекция: Билет 4. Представление информации. Естественные и формальные языки. Двоичное кодирование информации

Термин «информация» происходит от латинского слова informatio, что означает сведения, разъяснения, изложение. В настоящее время наука пытается найти общие свойства и закономерности, присущие многогранному понятию информация, но пока это понятие во многом остается интуитивным и получает различные смысловые наполнения в различных отраслях человеческой деятельности:

  • в быту информацией называют любые данные, сведения, знания, которые кого-либо интересуют. Например, сообщение о каких-либо событиях, о чьей-либо деятельности и т.п.;
  • в технике под информацией понимают сообщения, передаваемые в форме знаков или сигналов (в этом случае есть источник сообщений, получатель (приемник) сообщений, канал связи);
  • в теории информации под информацией понимают сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся степень неопределенности, неполноты знаний о них.

Применительно к компьютерной обработке данных под информацией понимают некоторую последовательность символических обозначений (букв, цифр, закодированных графических образов и звуков и т.п.), несущую смысловую нагрузку и представленную в понятном компьютеру виде. Каждый новый символ в такой последовательности символов увеличивает информационный объем сообщения.

Информация может существовать в виде:

  • текстов, рисунков, чертежей, фотографий;
  • световых или звуковых сигналов;
  • радиоволн;
  • электрических и нервных импульсов;
  • магнитных записей;
  • жестов и мимики;
  • запахов и вкусовых ощущений;
  • хромосом, посредством которых передаются по наследству признаки и свойства организмов, и т.д.

Человек воспринимает с помощью органов чувств следующую информацию:

  • визуальную (восприятие зрительных образов, различение цветов и т.д.) − с помощью зрения;
  • звуковую (восприятие музыки, речи, сигналов, шума и т.д.) − с помощью слуха;
  • обонятельную (восприятие запахов) − с помощью обоняния;
  • вкусовую (восприятие посредством вкусовых рецепторов языка) − с помощью вкуса;
  • тактильную (посредством кожного покрова восприятие информации о температуре, качестве предметов и т.д.) − с помощью осязания.

Воспринимая информацию с помощью органов чувств, человек стремится зафиксировать ее так, чтобы она стала понятной и другим, представляя ее в той или иной форме. Информацию можно представить в форме:

  1. Знаковой письменной, состоящей из различных знаков, среди которых принято выделять:
  • символьную в виде текста, чисел, специальных символов (например, текст учебника);
  • графическую (картины, карта и т.д.);
  • табличную (таблица Менделеева, умножения);
  • В виде жестов или сигналов (сигналы регулировщика дорожного движения и т.д.);
  • Устной словесной (например, разговор).
  • Форма представления информации очень важна при ее передаче: если человек плохо слышит, то передавать ему информацию в звуковой форме нельзя. В разные времена люди передавали информацию в различной форме с помощью: речи, дыма, барабанного боя, звона колоколов, письма, телеграфа, радио, телефона, факса.

    Независимо от формы представления и способа передачи информации, она всегда передается с помощью какого-либо языка.

    В качестве основного средства для обмена информацией с другими людьми человек использует естественные языки. Таковыми являются, например, русский, английский, японский и др. Они характеризуются тем, что носят национальный характер. Естественные языки существуют в устной (фонетика) и письменной (грамматика) форме (сейчас практически невозможно встретить язык, который не имеет письменной формы). В основе языка лежит алфавит, т.е. набор символов, которые используются для построения более крупных конструкций языка. В разных языках алфавит составляет от нескольких десятков до нескольких десятков тысяч символов. Вообще естественными языками как предметом изучения занимается такая наука, как филология. В информатике гораздо большее внимание уделяется формальным языкам.

    Основой формальных языков также служит алфавит. Но, в отличие от естественных, в формальных языках он довольно жестко фиксирован. Кроме того, правила грамматики и синтаксиса здесь более строгие, формализованные, фиксированные, существует ряд ограничений. В искусственных знаковых системах отсутствует многозначность. Каждая лексическая единица − слово − имеет ровно один смысл, и наоборот. Отсутствует или сильно снижена способность к перефразированию, то есть изменению формы высказывания при полном сохранении смысла. Например, русский язык позволяет сказать: «бабушкин сад», «сад бабушки», «сад, принадлежащий бабушке» − смысл этих фраз идентичен. Возможность перефразировки в искусственных языках усложнила бы процесс формализации, то есть взаимно-однозначного выражения содержания в форме. В отличие от естественных, искусственные языки ориентированы в основном на письменное представление. В силу этого появляется возможность их интернационализации, они становятся понятными и однозначно трактуемыми представителями разных национальностей, довольно часто используются в науке либо искусстве. Примерами таких языков могут служить язык математики (математическая символика), физики, химии, музыки (ноты) и т.д.

    Языки программирования (и другие средства записи алгоритмов) тоже относятся к формальным. При автоматизированной обработке информации нет возможности использования естественных языков.

    Правила построения конструкций формальных языков определяются их синтаксисом, а правила их толкования − семантикой. Синтактика знаковых систем занимается изучением их структуры, правил соединения отдельных знаков. Семантика изучает отношение между знаком и тем, что он замещает, представляет.

    Кодирование информации подразумевает преобразование знаков одной знаковой системы в знаки или группы знаков другой знаковой системы. Обратное преобразование называют декодированием. Код может быть задан в форме таблицы, графа, аналитического выражения, то есть в тех же формах, что и отображение.

    При кодировании информации для представления ее в памяти ЭВМ используется двоичный способ, т.е. любая информация, будь то числа, текст, графическое изображение, звук или видео, представляется универсальным двоичным кодом. Алфавит этого кода составляют символы 0 и 1. Почему был выбран именно этот способ кодирования? Дело в том, что в некоторых из первых ЭВМ предпринимались попытки внедрить десятичный или троичный код, но ни один из этих вариантов кодирования не дожил до современности. Ответ на вопрос довольно прост: два существенно различных состояния, представляющих, соответственно, 0 или 1, технически реализовать значительно проще, чем во всех остальных случаях. Действительно, отсутствие напряжения может изображать 0, наличие − 1; отсутствие намагниченности участка носителя информации − 0, намагниченность − 1 и т.д. Поэтому другие варианты были просто изжиты. Каждая цифра машинного кода несет 1 бит информации.

    еще рефераты
    Еще работы по информатике