Реферат: Аналоговая и цифровая аудио и видеоинформация

АСТРАХАНСКИЙГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Факультетматематики и информационных технологий

Кафедра Информационные системы

Курс:«Введение в специальность

                             РЕФЕРАТ

       на тему: «Аналоговая ицифровая аудио и видеоинформация».

<img src="/cache/referats/24849/image002.gif" v:shapes="_x0000_i1025">                                                                           

                                                                                             Выполнил:

студент  гр. ИМ-11

                                                                                          Юдин М.А.

                                                                                                                                        

                                                                                                       Проверила:

                                                                                   Чернышова  Н.А.

                                                                 

 

                   г.Астрахань 2006

                              Содержание.

 TOC o «1-3» u 1.   Введение.… PAGEREF_Toc155019051 h 3

2.  Отличия цифрового представления сигналов отаналогового.… PAGEREF_Toc155019052 h 3

3.    Способыпредставления звука в цифровом виде.… PAGEREF_Toc155019053 h 4

4.    MPEGLayer3.… PAGEREF_Toc155019054 h 5

5.      Видеоинформация.… PAGEREF_Toc155019055 h 7

5.1.   В началебыл аналог.… PAGEREF_Toc155019056 h 7

5.2.   Цифровоевидео.… PAGEREF_Toc155019057 h 7

5.3.    Основныехарактеристики цифрового видео.… PAGEREF_Toc155019058 h 8

6.   Сжатие видеоинформации.… PAGEREF_Toc155019059 h 9

6.1.   Основныепринципы  сжатия видеоданных.… PAGEREF_Toc155019060 h 9

6.2.   Методысжатия видеоданных.… PAGEREF_Toc155019061 h 10

7.    Основы MPEG-кодирования видео.… PAGEREF_Toc155019062 h 11

7.1.  Стандарт компрессии видеоданных MPEG-2.… PAGEREF_Toc155019063 h 11

7.2.        MPEG-4. Что этотакое?… PAGEREF_Toc155019064 h 11

8.  Преимущества цифровой передачи видеоданных.… PAGEREF_Toc155019065 h 12

9.  Заключение.… PAGEREF_Toc155019066 h 12

10.  Список использованной литературы.… PAGEREF_Toc155019067 h 13


  1.   Введение.

           Появление систем мультимедиа,безусловно, произвело революционные изменения в таких областях, какобразование, компьютерный тренинг, во многих сферах профессиональнойдеятельности, науки, искусства, в компьютерных играх и т.д. Но, согласитесь, невозможнопредставить себе современные мультимедиа системы без  звука и видео. В данной работе я хотел быостановиться на рассмотрении принципиальных отличий представления цифровыхсигналов от аналоговых, особенностях цифровой аудио и видеоинформации,алгоритмах  их сжатия (компрессии).

      2.  Отличия цифрового представления сигналов отаналогового.

<span Times New Roman",«serif»"> 

<span Times New Roman",«serif»">Традиционное аналоговое представлениесигналов основано на подобии (аналогичности) электрических сигналов (измененийтока и напряжения) представленным ими исходным сигналам (звуковому давлению,температуре, скорости и т.п.), а также подобии форм электрических сигналов вразличных точках усилительного или передающего тракта. Форма электрическойкривой, описывающей (также говорят — переносящей) исходный сигнал, максимальноприближена к форме кривой этого сигнала.

<span Times New Roman",«serif»">          Такое представление наиболее точно,однако малейшее искажение формы несущего электрического сигнала неизбежноповлечет за собой такое же искажение формы и сигнала переносимого. В терминахтеории информации, количество информации в несущем сигнале в точности равноколичеству информации в сигнале исходном, и электрическое представление несодержит избыточности, которая могла бы защитить переносимый сигнал отискажений при хранении, передаче и усилении.

<span Times New Roman",«serif»">         Цифровое представление электрическихсигналов призвано внести в них избыточность, предохраняющую от воздействия паразитныхпомех. Для этого на несущий электрический сигнал накладываются серьезныеограничения — его амплитуда может принимать только два предельных значения — 0и 1.

<span Times New Roman",«serif»">          Вся зона возможных амплитуд в этомслучае делится на три зоны: нижняя представляет нулевые значения, верхняя — единичные, а промежуточная является запрещенной — внутрь нее могут попадатьтолько помехи. Таким образом, любая помеха, амплитуда которой меньше половиныамплитуды несущего сигнала, не оказывает влияния на правильность передачизначений 0 и 1. Помехи с большей амплитудой также не оказывают влияния, еслидлительность импульса помехи ощутимо меньше длительности информационногоимпульса, а на входе приемника установлен фильтр импульсных помех.

<span Times New Roman",«serif»">         Сформированный таким образом цифровойсигнал может переносить любую полезную информацию, которая закодирована в видепоследовательности битов — нулей и единиц; частным случаем такой информацииявляются электрические и звуковые сигналы. Здесь количество информации внесущем цифровом сигнале значительно больше, нежели в кодированном исходном,так что несущий сигнал имеет определенную избыточность относительно исходного,и любые искажения формы кривой несущего сигнала, при которых еще сохраняетсяспособность приемника правильно различать нули и единицы, не влияют надостоверность передаваемой этим сигналом информации. Однако в случаевоздействия значительных помех форма сигнала может искажаться настолько, чтоточная передача переносимой информации становится невозможной — в ней появляютсяошибки, которые при простом способе кодирования приемник не сможет не толькоисправить, но и обнаружить. Для еще большего повышения стойкости цифровогосигнала к помехам и искажениям применяется цифровое избыточное кодирование двухтипов: проверочные (EDC — Error Detection Code, обнаруживающий ошибку код) икорректирующие (ECC — Error Correction Code, исправляющий ошибку код) коды.Цифровое кодирование состоит в простом добавлении к исходной информациидополнительных битов и/или преобразовании исходной битовой цепочки в цепочкубольшей длины и другой структуры. EDC позволяет просто обнаружить факт ошибки — искажение или выпадение полезной либо появление ложной цифры, однакопереносимая информация в этом случае также искажается; ECC позволяет сразу жеисправлять обнаруженные ошибки, сохраняя переносимую информацию неизменной. Дляудобства и надежности передаваемую информацию разбивают на блоки (кадры),каждый из которых снабжается собственным набором этих кодов.

<span Times New Roman",«serif»">         Каждый вид EDC/ECC имеет свой пределспособности обнаруживать и исправлять ошибки, за которым опять начинаютсянеобнаруженные ошибки и искажения переносимой информации. Увеличение объемаEDC/ECC относительно объема исходной информации в общем случае повышаетобнаруживающую и корректирующую способность этих кодов.

<span Times New Roman",«serif»">         В качестве EDC популярен циклическийизбыточный код CRC (Cyclic Redundancy Check), суть которого состоит в сложномперемешивании исходной информации в блоке и формированию коротких двоичныхслов, разряды которых находятся в сильной перекрестной зависимости от каждогобита блока. Изменение даже одного бита в блоке вызывает значительное изменениевычисленного по нему CRC, и вероятность такого искажения битов, при котором CRCне изменится, исчезающе мала даже при коротких (единицы процентов от длиныблока) словах CRC. В качестве ECC используются коды Хэмминга (Hamming) иРида-Соломона (Reed-Solomon), которые также включают в себя и функции EDC.

<span Times New Roman",«serif»">         Информационная избыточность несущегоцифрового сигнала приводит к значительному (на порядок и более) расширениюполосы частот, требуемой для его успешной передачи, по сравнению с передачейисходного сигнала в аналоговой форме. Кроме собственно информационнойизбыточности, к расширению полосы приводит необходимость сохранения достаточнокрутых фронтов цифровых импульсов.

<span Times New Roman",«serif»">          Кроме целей помехозащиты, информацияв цифровом сигнале может быть подвергнута также линейному или канальномукодированию, задача которого — оптимизировать электрические параметры сигнала(полосу частот, постоянную составляющую, минимальное и максимальное количествонулевых/единичных импульсов в серии и т.п.) под характеристики реального каналапередачи или записи сигнала.

<span Times New Roman",«serif»">          Полученный несущий сигнал, в своюочередь, также является обычным электрическим сигналом, и к нему применимылюбые операции с такими сигналами — передача по кабелю, усиление, фильтрование,модуляция, запись на магнитный, оптический или другой носитель и т.п.Единственным ограничением является сохранение информационного содержимого — так,чтобы при последующем анализе можно было однозначно выделить и декодироватьпереносимую информацию, а из нее — исходный сигнал.

<span Times New Roman",«serif»">3.<span Times New Roman"">     <span Times New Roman",«serif»"> Способы представления звука в цифровом виде.

<span Times New Roman",«serif»">Исходная форма звукового сигнала- непрерывное изменение амплитуды во  времени- представляется в цифровой форме с помощью «перекрестной  дискретизации» — по времени и по уровню.

<span Times New Roman",«serif»">         Согласно теореме Котельникова, любойнепрерывный процесс с ограниченным спектром может быть полностью описандискретной последовательностью его мгновенных значений, следующих с частотой,как минимум вдвое превышающей частоту наивысшей гармоники процесса; частота Fdвыборки мгновенных значений (отсчетов) называется частотой дискретизации.

<span Times New Roman",«serif»">          Из теоремы следует, что сигнал счастотой Fa может быть успешно дискретизирован по времени на частоте 2Fa тольков том случае, если он является чистой синусоидой, ибо любое отклонение отсинусоидальной формы приводит к выходу спектра за пределы частоты Fa. Такимобразом, для временной дискретизации произвольного звукового сигнала (обычноимеющего, как известно, плавно спадающий спектр), необходим либо выбор частотыдискретизации с запасом, либо принудительное ограничение спектра входногосигнала ниже половины частоты дискретизации.

<span Times New Roman",«serif»">          Одновременно с временнойдискретизацией выполняется амплитудная — измерение мгновенных значенийамплитуды и их представление в виде числовых величин с определенной точностью.Точность измерения (двоичная разрядность N получаемого дискретного значения)определяет соотношение сигнал/шум и динамический диапазон сигнала (теоретическиэто — взаимно-обратные величины, однако любой реальный тракт имеет также исобственный уровень шумов и помех).

<span Times New Roman",«serif»">            Полученный поток чисел (серийдвоичных цифр), описывающий звуковой сигнал, называют импульсно-кодовоймодуляцией или ИКМ (Pulse Code Modulation, PCM), так как каждый импульсдискретизованного по времени сигнала представляется собственным цифровым кодом.

<span Times New Roman",«serif»">             Чаще всего применяют линейноеквантование, когда числовое значение отсчета пропорционально амплитуде сигнала.Из-за логарифмической природы слуха более целесообразным было былогарифмическое квантование, когда числовое значение пропорционально величинесигнала в децибелах, однако это сопряжено с трудностями чисто техническогохарактера.

<span Times New Roman",«serif»">             Временная дискретизация иамплитудное квантование сигнала неизбежно вносят в сигнал шумовые искажения,уровень которых принято оценивать по формуле 6N + 10lg (Fдискр/2Fмакс) + C(дБ), где константа C варьируется для разных типов сигналов: для чистойсинусоиды это 1.7 дБ, для звуковых сигналов — от -15 до 2 дБ. Отсюда видно, чток снижению шумов в рабочей полосе частот 0..Fмакс приводит не только увеличениеразрядности отсчета, но и повышение частоты дискретизации относительно 2Fмакс,поскольку шумы квантования «размазываются» по всей полосе вплоть дочастоты дискретизации, а звуковая информация занимает только нижнюю часть этойполосы.

<span Times New Roman",«serif»">           В большинстве современных цифровыхзвуковых систем используются стандартные частоты дискретизации 44.1 и 48 кГц,однако частотный диапазон сигнала обычно ограничивается возле 20 кГц дляоставления запаса по отношению к теоретическому пределу. Также наиболеераспространено 16-разрядное квантование по уровню, что дает предельное соотношениесигнал/шум около 98 дБ. В студийной аппаратуре используются более высокиеразрешения — 18-, 20- и 24-разрядное квантование при частотах дискретизации 56,96 и 192 кГц. Это делается для того, чтобы сохранить высшие гармоники звуковогосигнала, которые непосредственно не воспринимаются слухом, но влияют наформирование общей звуковой картины.

<span Times New Roman",«serif»">           Для оцифровки более узкополосных именее качественных сигналов частота и разрядность дискретизации могутснижаться; например, в телефонных линиях применяется 7- или 8-разряднаяоцифровка с частотами 8..12 кГц.

<span Times New Roman",«serif»">          Представление аналогового сигнала вцифровом виде называется также импульсно-кодовой модуляцией (ИКМ, PCM — PulseCode Modulation), так как сигнал представляется в виде серии импульсовпостоянной частоты (временнАя дискретизация), амплитуда которых передаетсяцифровым кодом (амплитудная дискретизация). PCM-поток может быть какпараллельным, когда все биты каждого отсчета передаются одновременно понескольким линиям с частотой дискретизации, так и последовательным, когда битыпередаются друг за другом с более высокой частотой по одной линии.

           Сам цифровой звук и относящиеся кнему вещи принято обозначать общим термином Digital Audio; аналоговая ицифровая части звуковой системы обозначаются терминами Analog Domain и DigitalDomain.

4.<span Times New Roman"">    MPEG

Layer3.

<span Times New Roman",«serif»">            Для эффективного кодирования  аудиоданных применяются наиболее прогрессивныеметоды, в основе которых лежит свойство их универсальности и независимости откачества исходного звукового фрагмента, равно как и результирующего, взависимости от установок, применяемых в ходе сжатия.В настоящее время наиболееизвестны mp3, wma и divx audio. Все они используют так называемое кодированиедля восприятия (perceptual coding), при котором из звукового сигнала удаляетсяинформация, малозаметная для слуха. В результате, несмотря на изменение формы,и спектра сигнала, его слуховое восприятие практически не меняется, а степеньсжатия оправдывает незначительное уменьшение качества. Такое кодирование относитсяк методам сжатия с потерями, когда из сжатого сигнала уже невозможно точно восстановитьисходную волновую форму.                                                                        

<span Times New Roman",«serif»">           Приемы   удаления части информации базируются наособенностях человеческого слуха, называемой маскированием: при наличии вспектре звука выраженных пиков (преобладающих гармоник) более слабые частотныесоставляющие в непосредственной близости от них на слух практически невоспринимаются (маскируются). При кодировании весь звуковой поток разбиваетсяна мелкие кадры, каждый из которых преобразуется в спектральное представление иделится на ряд частотных полос.

<span Times New Roman",«serif»">           Внутри полос происходит определениеи удаление маскируемых звуков, после чего каждый кадр подвергается адаптивномукодированию прямо в спектральной форме. Все эти операции позволяют значительно(в несколько раз) уменьшить объем данных при сохранении качества, приемлемогодля большинства слушателей. Каждый из описанных методов кодированияхарактеризуется скоростью битового потока, с которой сжатая информация должнапоступать в декодер при восстановлении звукового сигнала. Декодер преобразуетсерию сжатых мгновенных спектров сигнала в обычную цифровую волновую форму. Влюбом видео или аудио потоке содержится значительное количество избыточнойинформации, которая независимо от ее присутствия или отсутствия не может бытьвоспринята человеческим ухом или глазом. Информация в MPEG-файле записанапоследовательными блоками — кадрами (frames), которые последовательносчитываются, а затем декодируются. Естественно, что чем больше поток, тембольшее количество информации остается в файле и соответственно тем большеепредставление об оригинальном звуке в нем содержится. Аудиоинформация, сжатая поданной схеме, может передаваться потоком (streaming), а может храниться вфайлах формата MP3 или WAV-MP3. Отличие второго от первого состоит в наличиидополнительного заголовка WAV-файла, что позволяет при наличии MP3-кодека всистеме для работы с таким файлом использовать стандартные средства Windows.

<span Times New Roman",«serif»">         Основная идея, на которой основаны всеметодики сжатия аудио сигнала с потерями, — отказ от кодирования тонких деталейзвучания оригинала, лежащих вне пределов возможностей человеческогослуха.  Звуки, находящиеся на границах резких перепадов уровня: послеочень громкого звука на протяжении небольшого отрезка времени около 100 мс иперед ним на протяжении 5 мс, человеческое ухо неспособно воспринимать другие,более тихие звуки.

<span Times New Roman",«serif»">           Говоря об этом, обычно имеют в видувозможности сознательного восприятия, игнорируя часто встречающийся эффект подпорогового восприятия различных мелких, сравнительно тихих деталей; с ихпомощью, например, нередко обеспечивается эмоциональная окраска композиции. Ноесли при кодировании все же ограничиваться только действительно невоспринимаемыми потерями, то можно говорить о сохранении исходного качествазакодированного аудио.

<span Times New Roman",«serif»">           Как известно, наиболее важную роль впередаче звукового сигнала играют вершины огибающей, в то время как переходамивблизи нулевой отметки можно пожертвовать. После такой обработки звуковаявыборка без труда сжимается с помощью обычных алгоритмов кодирования LZ илиHuffman. Но полученная ширина потока не yдовлетвоpила разработчиков. Радидальнейшего уменьшения объема потока была разработана подробнаяпсихоакустическая модель возможностей человеческого слуха, и из потока сталаисключаться информация о деталях звука, полностью или частично маскируемыхболее сильным сигналом. В данную категорию из-за низкого уровня автоматическипопадает большая часть сознательно не воспринимаемого сигнала (в принципе, навысших потоках происходил аналогичный процесс, но в несравнимо меньшей степени,с сохранением практически всех существенных деталей). Кроме того, для сниженияуровня потерь на низких потоках применяются особые виды техники, главный изкоторых – режим кодирования объединенного стерео (joint stereo). Потери прикодировании в режиме joint stereo на низких потоках (и только на них) оказываютсянамного ниже, чем при кодировании в режиме нормального стерео, еслистереоэффект особого значения не имеет; но, к сожалению, оно же приводит кплачевным результатам в часто встречающихся случаях записей с фазовым сдвигом,созданным при записи намеренно или появившимся в процессе эксплуатации записи.

<span Times New Roman",«serif»">            Суть кодирования в соответствии стехникой joint stereo состоит в пpеобpазовании всего стереосигнала в среднийсигнал между каналами и разность между ними. Но это только один вариант jointstereo, называемый MS Stereo. На особо низких потоках, таких как 96 Кбит/с,применяется техника MS/IS Stereo, в которой для некоторых частотных диапазоноввместо разницы между каналами хранится лишь информация о соотношении мощностейсигнала в разных каналах. Продукция FhG IIS так кодирует только высокиечастоты, но некоторые кодеры позволяют выбрать нужный диапазон вручную. К сожалению,выбор заключается в указании нужного значения одной из маловразумительныхвнутренних переменных формата, не разъясняемой в документации.

<span Times New Roman",«serif»">              Окончательной версии вышеупоминаемой психоакустической модели пока не существует, как нет иопределенного стандартного алгоритма кодирования. В связи с этим в общем случаеобъем и степень ощутимости потерь определяются, с одной стороны, потоком, а сдругой — особенностями конкретной разновидности психоакустической модели,использованной в каждом конкретном кодере. Последний момент имеет особенно большоезначение на низких потоках. Существует набор эффектов, которые на таких потокахкрайне плохо поддаются кодированию.

<span Times New Roman",«serif»">               И еще одна особенностьчеловеческого слуха  была учтена при разработке алгоритма компрессии —использование минимального порога слышимости. Наибольшей чувствительностью (2-4дБ) органы слуха обладают в среднем диапазоне частот порядка 2-5 кГц. На другихчастотах порогом чувствительности может стать значение громкости звука в 40 дБ.Иными словами, звуки, лежащие за порогом чувствительности, нет смысласохранять, поскольку они все равно не будут услышаны.

<span Times New Roman",«serif»">               На основании подобных эффектовсоздается так называемая психоакустическая модель, разбивающая весь частотныйспектр на части, в которых уровень звука примерно одинаков, после чего удаляетзвуки, не воспринимаемые человеком, как это было описано выше.

<span Times New Roman",«serif»">Существует три уровня  audioMPEG для сжатия стереофонических сигналов:

·<span Times New Roman"">                     

<span Times New Roman",«serif»">коэффициентсжатия 1:4 при допустимом потоке данных 384 Кбит/с;

·<span Times New Roman"">                     

<span Times New Roman",«serif»">1:6..1:8при 256..192 Кбит/с;

·<span Times New Roman"">                     

<span Times New Roman",«serif»">1:10..1:12при 128..112 Кбит/с.

<span Times New Roman",«serif»">           Теперь попробуем понять, каковаразница между уровнями (Layers). Например, в Layer 3 части разбитого спектранамного меньше, чем в первых двух, и по этой причине сжатие этим методомявляется наиболее продуктивным, а коэффициент  его достигает 1:12 беззаметной на слух потери качества. Поэтому столь широкое распространенное получилорасширение файлов MP3 (MPEG Layer 3).

<span Times New Roman",«serif»">          Для получения звука с качеством CDнеобходимо компрессировать аудиофайлы с потоком 256 Кбит/с, но для большинстваслушателей и большинства применений вполне достаточно 128 Кбит/с (по 64 Кбит/сна канал). Однако среди великого множества кодеров MP3-файлов следует отметитьнемногие, позволяющие сжимать звуковой ряд с переменным потоком (variablebitrate), обеспечивая, таким образом, максимальное качество и экономя дисковоепространство. Основой таких кодеков является использование в каждый моментвремени определенного значения потока и, как следствие, изменяющейся во времениприроды звукового сигнала (частоты и амплитуды звуковых колебаний). Для сжатияречи с отличным качеством вполне достаточно 24  или 32 Кбит/с.                                       

<span Times New Roman",«serif»">           Построение той самойпсихоакустической модели — сложный математический процесс, изобилующийвычислениями с плавающей запятой. Как следствие, подобный процесс, равно как ипроцесс сжатия, методом Хаффмана, требует солидной вычислительной мощности ипри декодировании файлов формата MPEG, и особенно — при кодировании.Первоначально для этой цели использовались специализированные устройства, выполнявшиевсе математические преобразования на аппаратном уровне, и лишь в последниегоды, после появления достаточно мощных процессоров, способных справляться сподобными вычислениями без особого ущерба для остальных приложений,  этостало возможным и с помощью специальных программ.

5.      Видеоинформация.

<span Times New Roman",«serif»">5.1.   В начале был аналог<span Times New Roman",«serif»">.<span Times New Roman",«serif»">

            Самым ранним методом передачивидеосигналов является аналоговый метод. Одним из первых видеоформатов наоснове этого принципа стал композитный видеосигнал. Композитное аналоговоевидео комбинирует все видеокомпоненты (яркость, цвет, синхронизацию и т. п.) водин сигнал. Из-за объединения этих элементов в одном сигнале качествокомпозитного видео далеко от совершенства. В результате мы имеем неточнуюпередачу цвета, недостаточно «чистую» картинку и другие факторыпотери качества.

             Композитное видео быстро уступилодорогу компонентному видео, в котором различные видеокомпоненты представленыкак независимые сигналы. Дальнейшие усовершенствования этого формата привели кпоявлению различные его вариаций: S-Video, RGB, Y, Pb, Pr и др.

             Тем не менее, всевышеперечисленные форматы остаются аналоговыми по своей сути, и, следовательно,обладают одним существенным недостатком: при копировании дубль всегда уступаетпо качеству оригиналу. Потеря качества при копировании видеоматериалааналогична фотокопированию, когда копия никогда не бывает такой же четкой ияркой, как оригинал.

<span Times New Roman",«serif»">5.2.   Цифровое видео<span Times New Roman",«serif»">.<span Times New Roman",«serif»">

Недостатки,присущие аналоговому способу воспроизведения видео, в конце концов привели кразработке цифрового видеоформата. На смену аналоговому видео пришло цифровое.В области профессионального видео применяется несколько цифровых видеоформатов:D1, D2, Digital BetaCam и др. В отличие от аналогового видео, качество которогопадает при копировании, каждая копия цифрового видео идентична оригиналу.

Хотя современныйвидеоряд базируется на цифровой основе, практически все цифровые видеоформатыдо сих пор в качестве носителя исходного сигнала используют пленку споследовательным доступом. Поэтому большинству профессионалов в области видеовсе еще привычней работать с пленкой, чем с компьютером.

Конечно, пленка вкачестве источника данных все еще остается более предпочтительной, чем жесткийдиск компьютера, поскольку вмещает значительно больший объем данных. Но затодля цифрового видеомонтажа использование компьютеров дает ряд существенныхпреимуществ: не только обеспечивает прямой доступ к любому видеофрагменту (чтоневозможно при работе с пленкой, поскольку к необходимым участкам можнодобраться лишь последовательно просматривая видеоматериал), но и предполагаетширокие возможности обработки изображения (редактирование, сжатие).

Это достаточновеские причины для перехода видеопроизводства с традиционного оборудования накомпьютерное.

Компьютерноецифровое видео представляет собой последовательность цифровых изображений исвязанный с ними звук. Элементы видео хранятся в цифровом формате.

              Существует множество способовзахвата, хранения и воспроизведения видео на компьютере. С появлениемкомпьютерного цифрового видео стихийно стали возникать самые разнообразныеформаты представления видеоданных, что поначалу привело к некоторой путанице ивызвало проблемы совместимости. Однако в последние годы благодаря усилиямМеждународной организации по стандартизации (ISO — International StandardsOrganisation)<span Times New Roman",«serif»;mso-fareast-font-family: «Times New Roman»;mso-ansi-language:RU;mso-fareast-language:RU;mso-bidi-language: AR-SA">[1]

выработаны единыестандарты на форматы видеоданных, которые мы позже рассмотрим. <span Times New Roman",«serif»">5.3.    Основные характеристики цифрового видео<span Times New Roman",«serif»">.<span Times New Roman",«serif»">

               Цифровое видео характеризуется четырьмяосновными факторами: частота кадра (Frame Rate), экранное разрешение (SpatialResolution), глубина цвета (Color Resolution) и качество изображения (ImageQuality).

               Частотакадра (Frame Rate). Стандартная скорость воспроизведения видеосигнала — 30кадров/с (для кино этот показатель составляет 24 кадра/с). Каждый кадр состоитиз определенного количества строк, которые прорисовываются не последовательно,а через одну, в результате чего получается два полукадра, или так называемых«поля». Поэтому каждая секунда аналогового видеосигнала состоит из 60полей (полукадров). Такой процесс называется interlaced видео.

               Между тем монитор компьютера дляпрорисовки экрана использует метод «прогрессивного сканирования»(progressive scan), при котором строки кадра формируются последовательно,сверху вниз, а полный кадр прорисовывается 30 раз каждую секунду. Разумеется,подобный метод получил название non-interlaced видео. В этом заключается основноеотличие между компьютерным и телевизионным методом формирования видеосигнала.

               Глубинацвета (Color Resolution). Этот показатель является комплексным и определяетколичество цветов, одновременно отображаемых на экране. Компьютеры обрабатываютцвет в RGB-формате (красный-зеленый-синий), в то время как видео использует идругие методы. Одна из наиболее распространенных моделей цветности длявидеоформатов — YUV. Каждая из моделей RGB и YUV может быть представленаразными уровнями глубины цвета (максимального количества цветов).

               Для цветовой модели RGB обычнохарактерны следующие режимы глубины цвета: 8 бит/пиксель (256 цветов), 16бит/пиксель (65,535 цветов) и 24 бит/пиксель (16,7 млн. цветов). Для модели YUVприменяются режимы: 7 бит/пиксель (4:1:1 или 4:2:2, примерно 2 млн. цветов), и8 бит/пиксель (4:4:4, примерно 16 млн. цветов).

                Экранноеразрешение (Spatial Resolution). Еще одна характеристика — экранноеразрешение, или, другими словами, количество точек, из которых состоитизображение на экране. Так как мониторы PC и Macintosh обычно рассчитаны набазовое разрешение в 640 на 480 точек (пикселей), многие считают, что такойформат является стандартным. К сожалению, это не так. Прямой связи междуразрешением аналогового видео и компьютерного дисплея нет.

Стандартный аналоговый видеосигналдает полноэкранное изображение без ограничений размера, так часто присущихкомпьютерному видео. Телевизионный стандарт NTSC (National Television StandardsCommitte), разработан Национальным комитетом по телевизионным стандартам США.Используемый в Северной Америке и Японии, он предусматривает разрешение 768 на484. Стандарт PAL (Phase Alternative), распространенный в Европе, имеетнесколько большее разрешение — 768 на 576 точек.

               Поскольку разрешение аналогового и компьютерного видео различается, припреобразовании аналогового видео в цифровой формат приходится иногдамасштабировать и уменьшать изображение, что приводит к некоторой потерекачества.

Качествоизображения (Image Quality). Последняя, и наиболее важная характеристика — это качество видеоизображения. Требования к качеству зависят от конкретнойзадачи. Иногда достаточно, чтобы картинка была размером в четверть экрана спалитрой из 256-ти цветов (8 бит), при скорости воспроизведения 15 кадров/с. Вдругих случаях требуется полноэкранное видео (768 на 576) с палитрой в 16,7млн. цветов (24 бит) и полной кадровой разверткой (24 или 30 кадров/с).

<span Times New Roman",«serif»">6.   Сжатиевидео<span Times New Roman",«serif»">информации.<span Times New Roman",«serif»">

Следует исходитьиз разумной достаточности при определении необходимой степени сжатия. При этомнеобходимо учитывать, как четыре характеристики (частота кадра, экранноеразрешение, глубина цвета и качество изображения) влияют на объем и качествовидео. Вы

еще рефераты
Еще работы по программному обеспечению