Реферат: Кодирование информации
<m:mathPr> <m:mathFont m:val=«Cambria Math»/> <m:brkBin m:val=«before»/> <m:brkBinSub m:val="--"/> <m:smallFrac m:val=«off»/> <m:dispDef/> <m:lMargin m:val=«0»/> <m:rMargin m:val=«0»/> <m:defJc m:val=«centerGroup»/> <m:wrapIndent m:val=«1440»/> <m:intLim m:val=«subSup»/> <m:naryLim m:val=«undOvr»/> </m:mathPr>План реферата.
1. План реферата
стр.1
2. Кодирование информации
стр.2
3. Способы кодирования информации:
стр.3
— Кодирование символьной (текстовой) информации
стр.3
— Кодирование числовой информации
стр.3
— Кодирование графической информации
стр.4
— Кодирование звуковой информации
стр.5
Кодированиеинформации.
Код — это набор условныхобозначений (или сигналов) для записи (или передачи) некоторых заранееопределенных понятий.
Кодирование информации – это процессформирования определенного представления информации. В более узком смысле подтермином «кодирование» часто понимают переход от одной формы представленияинформации к другой, более удобной для хранения, передачи или обработки.
Обычно каждый образ при кодировании (иногда говорят — шифровке) представленииотдельным знаком.
Знак — это элемент конечногомножества отличных друг от друга элементов.
В более узком смысле под термином«кодирование» часто понимают переход от одной формы представленияинформации к другой, более удобной для хранения, передачи или обработки.
Компьютер может обрабатыватьтолько информацию, представленную в числовой форме. Вся другая информация(например, звуки, изображения, показания приборов и т. д.) для обработки накомпьютере должна быть преобразована в числовую форму. Например, чтобыперевести в числовую форму музыкальный звук, можно через небольшие промежуткивремени измерять интенсивность звука на определенных частотах, представляярезультаты каждого измерения в числовой форме. С помощью программ длякомпьютера можно выполнить преобразования полученной информации, например«наложить» друг на друга звуки от разных источников.
Аналогичным образом на компьютереможно обрабатывать текстовую информацию. При вводе в компьютер каждая буквакодируется определенным числом, а при выводе на внешние устройства (экран илипечать) для восприятия человеком по этим числам строятся изображения букв.Соответствие между набором букв и числами называется кодировкойсимволов.
Как правило, все числа вкомпьютере представляются с помощью нулей и единиц (а не десяти цифр, как этопривычно для людей). Иными словами, компьютеры обычно работают в двоичнойсистеме счисления, поскольку при этом устройства для их обработки получаютсязначительно более простыми. Ввод чисел в компьютер и вывод их для чтениячеловеком может осуществляться в привычной десятичной форме, а все необходимыепреобразования выполняют программы, работающие на компьютере.
Способыкодирования информации.
Одна и та же информация можетбыть представлена (закодирована) в нескольких формах. C появлением компьютероввозникла необходимость кодирования всех видов информации, с которыми имеет делои отдельный человек, и человечество в целом. Но решать задачу кодированияинформации человечество начало задолго до появления компьютеров. Грандиозныедостижения человечества — письменность и арифметика — есть не что иное, каксистема кодирования речи и числовой информации. Информация никогда непоявляется в чистом виде, она всегда как-то представлена, как-то закодирована.
Двоичное кодирование – один из распространенных способовпредставления информации. В вычислительных машинах, в роботах и станках счисловым программным управлением, как правило, вся информация, с которой имеетдело устройство, кодируется в виде слов двоичного алфавита.
Кодирование символьной (текстовой)информации.
Основнаяоперация, производимая над отдельными символами текста — сравнение символов.
При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и длина этого кода, а сам выбор принципакодирования практически не имеет значения.
Длякодирования текстов используются различные таблицы перекодировки. Важно, чтобыпри кодировании и декодировании одного и того же текста использовалась одна ита же таблица.
Таблица перекодировки — таблица, содержащая упорядоченныйнекоторым образом перечень кодируемых символов, в соответствии с которойпроисходит преобразование символа в его двоичный код и обратно.
Наиболее популярные таблицы перекодировки: ДКОИ-8, ASCII,CP1251, Unicode.
Историческисложилось, что в качестве длины кода для кодирования символов было выбрано 8бит или 1 байт. Поэтому чаще всего одному символу текста, хранимому в компьютере, соответствует один байт памяти.
Различных комбинаций из 0 и 1 при длине кода 8 бит можетбыть 28 = 256, поэтому с помощью одной таблицы перекодировки можнозакодировать не более 256 символов. При длине кода в 2 байта (16 бит) можнозакодировать 65536 символов.
Кодирование числовой информации.
Сходство в кодировании числовой итекстовой информации состоит в следующем: чтобы можно было сравнивать данные этого типа, у разных чисел (как и у разныхсимволов) должен быть различный код. Основное отличие числовых данных отсимвольных заключается в том, что над числами кроме операции сравненияпроизводятся разнообразные математическиеоперации: сложение, умножение, извлечение корня, вычисление логарифма и пр.Правила выполнения этих операций в математике подробно разработаны для чисел,представленных в позиционной системе счисления.
Основной системой счисления дляпредставления чисел в компьютере является двоичная позиционная системасчисления.
Кодирование текстовой информации
В настоящее время, большая частьпользователей, при помощи компьютера обрабатывает текстовую информацию, котораясостоит из символов: букв, цифр, знаков препинания и др. Подсчитаем, скольковсего символов и какое количество бит нам нужно.
10 цифр, 12 знаков препинания, 15знаков арифметических действий, буквы русского и латинского алфавита, ВСЕГО:155 символов, что соответствует 8 бит информации.
Единицы измерения информации.
1 байт = 8 бит
1 Кбайт = 1024 байтам
1 Мбайт = 1024 Кбайтам
1 Гбайт = 1024 Мбайтам
1 Тбайт = 1024 Гбайтам
Суть кодирования заключается втом, что каждому символу ставят в соответствие двоичный код от 00000000 до11111111 или соответствующий ему десятичный код от 0 до 255.
Необходимо помнить, что внастоящее время для кодировки русских букв используют пять различных кодовыхтаблиц (КОИ — 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные припомощи одной таблицы не будут правильно отображаться в другой
Основным отображением кодированиясимволов является код ASCII — AmericanStandardCodeforInformationInterchange — американский стандартный код обмена информацией, который представляет из себятаблицу 16 на 16, где символы закодированы в шестнадцатеричной системесчисления.
Кодирование графической информации.
Важным этапом кодированияграфического изображения является разбиение его на дискретные элементы(дискретизация).
Основными способами представленияграфики для ее хранения и обработки с помощью компьютера являются растровые ивекторные изображения
Векторное изображение представляетсобой графический объект, состоящий из элементарных геометрических фигур (чащевсего отрезков и дуг). Положение этих элементарных отрезков определяетсякоординатами точек и величиной радиуса. Для каждой линии указывается двоичныекоды типа линии (сплошная, пунктирная, штрихпунктирная),толщины и цвета.
Растровое изображениепредставляет собой совокупность точек (пикселей), полученных в результатедискретизации изображения в соответствии с матричным принципом.
Матричный принцип кодирования графическихизображений заключается в том, что изображение разбивается на заданноеколичество строк и столбцов. Затем каждый элемент полученной сетки кодируетсяпо выбранному правилу.
Pixel (picture element — элементрисунка) — минимальная единица изображения, цвет и яркость которой можно задатьнезависимо от остального изображения.
В соответствии с матричнымпринципом строятся изображения, выводимые на принтер, отображаемые на экране дисплея, получаемые с помощьюсканера.
Качество изображения будет темвыше, чем «плотнее» расположены пиксели, то есть чем большеразрешающая способность устройства, и чем точнее закодирован цвет каждого изних.
Для черно-белого изображения кодцвета каждого пикселя задается одним битом.
Если рисунок цветной, то длякаждой точки задается двоичный код ее цвета.
Поскольку и цвета кодируются вдвоичном коде, то если, например, вы хотите использовать 16-цветный рисунок, тодля кодирования каждого пикселя вам потребуется 4 бита (16=24), аесли есть возможность использовать 16 бит (2 байта) для кодирования цветаодного пикселя, то вы можете передать тогда 216 = 65536 различныхцветов. Использование трех байтов (24 битов) для кодирования цвета одной точкипозволяет отразить 16777216 (или около 17 миллионов) различных оттенков цвета — так называемый режим “истинного цвета” (True Color). Заметим, что этоиспользуемые в настоящее время, но далеко не предельные возможности современныхкомпьютеров.
Кодирование звуковой информации.
Из курса физики вам известно, чтозвук — это колебания воздуха. По своей природе звук является непрерывнымсигналом. Если преобразовать звук в электрический сигнал (например, с помощьюмикрофона), мы увидим плавно изменяющееся с течением времени напряжение.
Для компьютерной обработкианалоговый сигнал нужно каким-то образом преобразовать в последовательностьдвоичных чисел, а для этого его необходимо дискретизировать и оцифровать.
Можно поступить следующимобразом: измерять амплитуду сигнала через равные промежутки времени изаписывать полученные числовые значения в память компьютера.