Реферат: MPEG форматы

               

НАУ.ІСПР.24391.03.07.05

Вим  Стор.    №  документу   Підпис      Дата

Стор.

2

<img src="/cache/referats/24420/image001.gif" v:shapes="_x0000_s1026 _x0000_s1027 _x0000_s1028 _x0000_s1029 _x0000_s1030 _x0000_s1031 _x0000_s1032 _x0000_s1033 _x0000_s1034 _x0000_s1035 _x0000_s1036 _x0000_s1037 _x0000_s1038 _x0000_s1039 _x0000_s1040 _x0000_s1041 _x0000_s1042 _x0000_s1043 _x0000_s1044 _x0000_s1045 _x0000_s1046 _x0000_s1047 _x0000_s1048 _x0000_s1049 _x0000_s1050 _x0000_s1051"><span Arial",«sans-serif»">Описание формата

<span Arial",«sans-serif»;mso-ansi-language: EN-US">MPEG<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">В январе 1988 года врамках объединенного технического комитета по информационным технологиям JTC1Международной организации по стандартизации ISO и Международной электротехническойкомиссии IEC была образована рабочая группа экспертов по кодированию движущихсяизображений, перед которой была поставлена задача разработки стандартовкодирования изображения и звука с целью устранения избыточности. Группаполучила официальное наименование ISO/IEC JTC1/SC29/WG11 (11 рабочая группа 29подкомитета), но мировую известность она приобрела под названием MPEG — MovingPicture Expert Group. В первом заседании группы в мае 1998 года участвовало 25экспертов, сейчас группа MPEG объединяет сотни специалистов, представляющихоколо 200 организаций из более чем 20 стран. Общая цель работы группы остаетсяпрежней – компрессия, обработка и кодовое представление изображения, звука и ихкомбинаций. Основные проекты группы – это MPEG-1 (стандарт ISO/IEC 11172) — Кодирование изображение и звука при скоростях передачи данных до 1.5Мбит/с,MPEG-2 (ISO/IEC 13818) – Обобщенное кодирование изображения и звука, MPEG-4(ISO/IEC 14496) – Кодирование аудиовизуальных объектов, MPEG-7 (ISO/IEC 15938)– Описание содержания объектов мультимедиа. Из этого списка лишь стандартMPEG-7 пока не утвержден ISO, но работа над всеми проектами (кроме MPEG-1)продолжается.

<span Arial",«sans-serif»">- MPEG-1: оригинальный формат для хранения ивоспроизведения видео- и аудиоданных на мультимедиа носителях данных. Принят вкачестве официального стандарта в 1992 г. Разрабатывался для доставки видео наCD-ROM (скорость около 1,5 Мбит/с) и получил широкое распространение во многомблагодаря дискам VideoCD. Потенциально поддерживает телевизионное качествовидео.

<span Arial",«sans-serif»">- MPEG-2: более новый стандарт (утвержден вноябре 1994 г.). Разработан как дополнение к стандарту MPEG-1. Поддерживаетпередачу высококачественного видео по высокоскоростным цифровым каналам. Интенсивностьпотока данных от до 2 до 10 Мбайт/сек. Разрешение 720х480 и 1280х720, частота60 кадров в секунду со звуковыми данными CD-качества. Подходит для всехстандартов телевидения и даже систем телевидения высокой точности (HDTV, HighDefinition Television). Используется при записи DVD дисков.

<span Arial",«sans-serif»">Параллельно с разработкой стандарта MPEG-2группа MPEG занималась также работой по созданию стандарта MPEG-3,ориентированного на использование в системах телевидения высокой четкости.Однако, в ходе исследований было установлено, что в системах телевидениявысокой четкости можно использовать уже созданные стандарты MPEG-1 и MPEG-2. Вкачестве стандарта для систем телевидения высокой четкости был принят MPEG-2.

<span Arial",«sans-serif»">- MPEG-4: начинал разрабатываться как форматдля передачи видео и аудиоданных по каналам с низкой пропускной способностью, втом числе беспроводным. MPEG-4, версия 1 был одобрен в октябре 1998 г., какстандарт ISO/IEC 14496. Этот формат был расчитан для применения в системахвидеотелефонии, мультимедийной электронной почте, электронных информационныхизданиях. Предусматривал разрешение 174х144 пиксела при 10 кадрах в секунду ипозволял передавать данные со скоростью от 4800 до 64000 бит/сек.

<span Arial",«sans-serif»">Базируется на формате файлов

<span Arial",«sans-serif»;mso-ansi-language: EN-US">Qui<span Arial",«sans-serif»">с<span Arial",«sans-serif»;mso-ansi-language: EN-US">ktime<span Arial",«sans-serif»">(QuickTime — стандарт, архитектура программного обеспечения, которая позволяетсоздавать, объединять и публиковать все типы цифровых мультимедиа данных.Используя QuickTime, программные приложения могут легко работать с широкимкругом форматов файлов и кодеков. QuickTime включает три основополагающихэлемента — QuickTime видео формат (Movie file format), слой абстрактногоносителя (Media Abstraction Layer) и богатый набор встроенных медиа — служб. QuickTimeвидео формат хорош тем, что он платформенно независим, открыт для расширения. Всвязи с названными преимуществами, поддерживается многими производителями.QuickTime слой абстрактного носителя определяет исчерпывающий набор сервисныхфункций покрывающих все аспекты создания, редактирования и воспроизведенияцифрового материала. Среди них: синхронизация по времени, компрессия идекомпрессия аудио- и видеоданных, преобразование форматов, масштабирование,смешивание и транскодирование, аудио- и видеоэффекты и переходы, синхронизациячтения и записи, захват данных, импорт и экспорт данных, стандартныйпользовательский интерфейс. QuickTime поддерживает широкий набор типовмультимедиа данных (видео, аудио, текст, временной код, музыкальный MIDI — интерфейс, спрайты, анимацию и др.).)<span Times New Roman",«serif»">http://www.niac.ru/graphinfo.nsf/46016b1dde1f9183432566f9003f0582/80c95319b76ef641432567770072c2a5!OpenDocument.

<span Arial",«sans-serif»">- MPEG-7: «Multimedia ContentDescription Interface» — стандарт описания мультимедийного содержания дляинформационного поиска, планируется к утверждению в июле 2001 г. В октябре 1996года группа MPEG приступила к разработке формата сжатия MPEG 7, призваннымопределить универсальные механизмы описания аудио и видео информации. Этотформат получил название Multimedia Content Description Interface. В отличие отпредыдущих форматов сжатия семейства MPEG, MPEG 7 описывает информацию,представленную в любой форме (в том числе в аналоговой) и не зависит от средыпередачи данных. Как и его предшественники, формат сжатия MPEG 7 генерируетмасштабируемую информацию в рамках одного описания. Формат сжатия MPEG 7использует многоуровневую структуру описания аудио и видео информации. Навысшем уровне прописываются свойства файла, такие как название, имя создателя,дата создания и т.д. На следующем уровне описания формат сжатия MPEG 7указывает особенности сжимаемой аудио или видео информации – цвет, текстура,тон или скорость. Одной из отличительных особенностей MPEG 7 является егоспособность к определению типа сжимаемой информации. Если это аудио или видеофайл, то он сначала сжимается с помощью алгоритмов MPEG 1, MPEG 2, MPEG 4, азатем описывается при помощи MPEG 7. Такая гибкость в выборе методов сжатиязначительно снижает объем информации и ускоряет процесс сжатия. Основноепреимущество формата сжатия MPEG 7 над его предшественниками состоит вприменении уникальных дескрипторов и схем описания, которые, помимо всегопрочего, делают возможным автоматическое выделение информации как по общим, таки по семантическим признакам, связанным с восприятием информации человеком.Процедура занесения в каталог и поиска данных находятся вне сферы рассмотренияэтого формата сжатия.

НАУ.ІСПР.24391.03.07.05

Вим  Стор.    №  документу   Підпис      Дата

Стор.

3

<img src="/cache/referats/24420/image002.gif" v:shapes="_x0000_s1052 _x0000_s1053 _x0000_s1054 _x0000_s1055 _x0000_s1056 _x0000_s1057 _x0000_s1058 _x0000_s1059 _x0000_s1060 _x0000_s1061 _x0000_s1062 _x0000_s1063 _x0000_s1064 _x0000_s1065 _x0000_s1066 _x0000_s1067 _x0000_s1068 _x0000_s1069 _x0000_s1070 _x0000_s1071 _x0000_s1072 _x0000_s1073 _x0000_s1074 _x0000_s1075 _x0000_s1076 _x0000_s1077"><span Arial",«sans-serif»">Разработка форматасжатия MPEG 21 — это долговременный проект, который называется «Системамультимедийных средств» (Multimedia Framework). Над разработкой этогоформата сжатия эксперты начали работать в июне 2000 г. На первых этапах планировалосьпровести расширение, унификацию и объединение форматов MPEG 4 и MPEG 7 в единуюобобщающую структуру. Подразумевалось, что она будет обеспечивать глубокуюподдержку управления правами и платежными системами, а также качествомпредоставляемых услуг.

<span Arial",«sans-serif»;mso-ansi-language: EN-US">MPEG

<span Arial",«sans-serif»">1

<span Arial",«sans-serif»">Как и метод группы

<span Arial",«sans-serif»;mso-ansi-language:EN-US">JPEG<span Arial",«sans-serif»">, алгоритм MPEG-1использует дискретное косинусное преобразование (Diskrete Cosine Transform). Вчастности, при применении MPEG-алгоритма специальные средства позволяют присжатии текущего кадра включать ссылки на части изображения, оставшегося неизменнымот предыдущего кадра. Как обычно, вначале идет преобразование информации вбазис YUV и ее прореживание. После этого выполняется дискретное косинусноепреобразование. Аналогичным образом используется и кодирование Хаффмана (В основеалгоритма кодирования Хаффмана лежит довольно простой принцип: символызаменяются кодовыми последовательностями различной длины. Чем чаще используетсясимвол, тем короче должна быть кодовая последовательность. Именно поэтомуалгоритм Хаффмана называется также кодированием символами переменной длины(Variable-Lenth Coding). Код переменной длины позволяет записывать наиболеечасто встречающиеся символы короткими кодовыми последовательностями, а редковстречающиеся – более длинными. Например, для английского текста символам Е, Т иА можно поставить в соответствие 3-битовые последовательности, а J, Z и Q –8-битовые. В одних алгоритмах реализации алгоритма Хаффмана используютсяготовые кодовые таблицы, в других – кодовая таблица строится только на основе статистическогоанализа имеющейся информации. Кодирование по Хаффману гарантирует возможностьполного последующего декодирования.). Тем не менее основной задачей дляMPEG-алгоритма является определение вектора движения, то есть основногонаправления, в котором происходят изменения. Для этой цели на различных этапахвыполнения алгоритма могут использоваться операции сравнения, а такжепредсказания назад и вперед, осреднения блоков и т.д.

<span Arial",«sans-serif»">В соответствии с MPEG существует три видакадров: типа I (Inter frame) — исходные (ключевые), типа Р (Predicted frame) — предсказуемые и типа В (Bi-directional frames) — двунаправленные. Кадр типа Iявляется базовым. Сжатие такого кадра может происходить только по методуобработки неподвижного изображения, например, методом типа JPEG. Кадр типа Рполучается на основе информации одного I — или одного предсказуемого Р-кадра. Авот кадр типа В получается на основе I- или Р-кадров, причем одного из них впрошлом, а другого — в будущем. На самом деле все выглядит не так фантастически.как кажется. Разумеется. что декодирующее устройство получает сначала фрейм I,затем Р и только после этого формирует фрейм В. Данный метод обеспечиваеткоэффициенты сжатия в пределах от 40:1 до 200:1.

<span Arial",«sans-serif»;mso-ansi-language:EN-US">MPEG

<span Arial",«sans-serif»">2

<span Arial",«sans-serif»">Поток видеоданных,определяемый спецификацией 13818-2, представляет собой иерархическую структуру,элементы которой строятся и объединяются друг с другом в соответствии с определеннымисинтаксическими и семантическими правилами. Существует 6 типов элементов этойиерархической структуры:

·<span Times New Roman"">  

<span Arial",«sans-serif»">Видеопоследовательность

·<span Times New Roman"">  

<span Arial",«sans-serif»">Группаизображений

·<span Times New Roman"">  

<span Arial",«sans-serif»">Изображение

·<span Times New Roman"">  

<span Arial",«sans-serif»">Срез

·<span Times New Roman"">  

<span Arial",«sans-serif»">Макроблок

·<span Times New Roman"">  

<span Arial",«sans-serif»">Блок.

<span Arial",«sans-serif»">Видеопоследовательность– элемент потока видеоданных высшего уровня. Она представляет собой сериюпоследовательных кадров телевизионного изображения. MPEG-2 допускает как построчные,так и чересстрочные последовательности. Чересстрочная последовательность – этосерия телевизионных полей. В процессе компрессии поля могут кодироватьсяраздельно. Это дает изображения типа «поле». Два поля, кодируемые кактелевизионный кадр, образуют изображение типа «кадр». В одной чересстрочнойпоследовательности могут использоваться и изображения-поля, иизображения-кадры. В последовательностях с построчным разложением каждоеизображение представляет собой кадр. В соответствии с используемыми методамидифференциального кодирования различают три типа изображений: I, P и B.Изображение типа I кодируется с использованием только той информации, котораясодержится в нем самом (I — Intra-coded picture). В нем устраняется толькопространственная избыточность. При кодировании P и B изображений используетсямежкадровое кодирование. При кодировании изображения типа P формируетсяразность между исходным изображением и предсказанием, полученным на основепредшествующего или последующего изображения типа I (P – Predictive-codedpicture). Изображение типа B – это изображение, при кодировании которогоиспользуется предсказание, сформированное на основе предшествующего ипоследующего изображений типа I или P (B – Bidirectionally-predicted-codedpicture). В изображениях типа P и B устраняется и пространственная, и временнаяизбыточность. Серия изображений, содержащих одно I-изображение, называетсягруппой изображений. Пример видеопоследовательности с различными типамиизображений показан на рис.1 (стрелками показаны направления предсказания впределах одной группы изображений). Чем больше группа изображений, тем большаястепень компрессии может быть достигнута.

НАУ.ІСПР.24391.03.07.05

Вим  Стор.    №  документу   Підпис      Дата

Стор.

4

<img src="/cache/referats/24420/image005.gif" v:shapes="_x0000_s1104 _x0000_s1105 _x0000_s1078 _x0000_s1079 _x0000_s1080 _x0000_s1081 _x0000_s1082 _x0000_s1083 _x0000_s1084 _x0000_s1085 _x0000_s1086 _x0000_s1087 _x0000_s1088 _x0000_s1089 _x0000_s1090 _x0000_s1091 _x0000_s1092 _x0000_s1093 _x0000_s1094 _x0000_s1095 _x0000_s1096 _x0000_s1097 _x0000_s1098 _x0000_s1099 _x0000_s1100 _x0000_s1101 _x0000_s1102 _x0000_s1103"> <span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">


<span Arial",«sans-serif»">С информационной точкизрения каждое изображение представляет собой три прямоугольных матрицы отсчетовизображения: яркостную Y и две матрицы цветности Cb и Cb. Стандарт MPEG-2 допускаетразличные структуры матриц. Соотношение между количеством отсчетов яркости ицветности определяется форматом дискретизации. В случае формата 4:2:0 размерыматриц Cb и Cb в 2 раза меньше, чем Y, и в горизонтальном, и в вертикальномнаправлениях (рис.5). Формат 4:2:2 отличается тем, что все три матрицы имеютодинаковые размеры по вертикали, но в горизонтальном направлении матрицыцветности имеют в два раза меньшее количество элементов (рис.6). В формате4:4:4 все матрицы одинаковы (рис.6).

<span Arial",«sans-serif»;mso-ansi-language:EN-US">

<span Arial",«sans-serif»;mso-ansi-language: EN-US">

<span Arial",«sans-serif»">


<img src="/cache/referats/24420/image006.jpg" v:shapes="_x0000_i1025"><span Arial",«sans-serif»">

НАУ.ІСПР.24391.03.07.05

Вим  Стор.    №  документу   Підпис      Дата

Стор.

5

<img src="/cache/referats/24420/image007.gif" v:shapes="_x0000_s1106 _x0000_s1107 _x0000_s1108 _x0000_s1109 _x0000_s1110 _x0000_s1111 _x0000_s1112 _x0000_s1113 _x0000_s1114 _x0000_s1115 _x0000_s1116 _x0000_s1117 _x0000_s1118 _x0000_s1119 _x0000_s1120 _x0000_s1121 _x0000_s1122 _x0000_s1123 _x0000_s1124 _x0000_s1125 _x0000_s1126 _x0000_s1127 _x0000_s1128 _x0000_s1129 _x0000_s1130 _x0000_s1131"><span Arial",«sans-serif»"><img src="/cache/referats/24420/image009.jpg" v:shapes="_x0000_i1026">

<img src="/cache/referats/24420/image011.jpg" v:shapes="_x0000_i1027">

Каждое изображение делится на срезы, которые состоят из макроблоков (рис.2).Макроблок складывается из блоков размером 8х8 элементов изображения (пикселов).Каждый макроблок содержит группу из 4 блоков с отсчетами яркости (из областиизображения с размерами 16х16 пикселов) и группу блоков с отсчетами цветности,взятых из той же области изображения, что и отсчеты блоков яркости. Числоблоков с отсчетами цветности зависит от формата дискретизации: по одному блокуCb и Cb в формате 4:2:0, по два – в формате 4:2:2, по 4 – в формате 4:4:4(рис.3). В изображениях типа «кадр», в которых может использоваться и кадровое,и полевое кодирование, возможны 2 варианта внутренней организации макроблока(рис.4). В случае кадрового кодирования каждый блок яркости Y образуется изчередующихся строк двух полей (рис.4а). При полевом кодировании каждый блок Yобразован из строк только одного из двух полей (рис.4б). Блоки цветностиобразуются по таким же правилам в случае форматов дискретизации 4:2:2 и 4:4:4.Однако при использовании формата 4:2:0 блоки цветности организуются длявыполнения дискретного косинусного преобразования в рамках кадровой структуры(рис.4а).

<img src="/cache/referats/24420/image013.jpg" v:shapes="_x0000_i1028">

Все структурные элементы потока видеоданных, полученного в результатевнутрикадрового и межкадрового кодирования (кроме макроблока и блока),дополняются специальными и уникальными стартовыми кодами. Каждый элементсодержит заголовок, за которым следуют данные элементов более низкого уровня. Взаголовке видеопоследовательности (как элемента высшего уровня) приводится разнообразнаядополнительная информация, например, размеры и соотношение сторон изображения,частота кадров, скорость потока данных, матрица квантования, формат дискретизациицветности изображения, координаты основных цветов и белого цвета, параметрыматрицы для формирования яркостного и цветоразностных сигналов, параметрыпередаточной характеристики (гамма).

НАУ.ІСПР.24391.03.07.05

Вим  Стор.    №  документу   Підпис      Дата

Стор.

6

<img src="/cache/referats/24420/image014.gif" v:shapes="_x0000_s1132 _x0000_s1133 _x0000_s1134 _x0000_s1135 _x0000_s1136 _x0000_s1137 _x0000_s1138 _x0000_s1139 _x0000_s1140 _x0000_s1141 _x0000_s1142 _x0000_s1143 _x0000_s1144 _x0000_s1145 _x0000_s1146 _x0000_s1147 _x0000_s1148 _x0000_s1149 _x0000_s1150 _x0000_s1151 _x0000_s1152 _x0000_s1153 _x0000_s1154 _x0000_s1155 _x0000_s1156 _x0000_s1157"><span Arial",«sans-serif»">Принципы видеокомпрессии

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">Сокращениепространственной избыточности выполняется в изображениях типа I и достигаетсяна уровне блока. Набор операций такого кодирования – дискретное косинусноепреобразование; взвешенное квантование, определяемое элементами матрицыквантования; энтропийное кодирование серии коэффициентов косинусногопреобразования, полученной в результате зигзаг-сканирования матрицыкоэффициентов. Метод сокращения временной избыточности – дифференциальнаяимпульсно-кодовая модуляция с компенсацией движения при кодировании изображенийтипа P и B. При кодировании формируется разность между исходным изображением ипредсказанием, полученным на основе предшествующего и/или последующегоизображения. Полученная разность подвергается дискретному косинусномупреобразованию, взвешенному квантованию и энтропийному кодированию. Дляповышения точности предсказания и, тем самым, сокращения объема необходимых дляпредставления изображения данных, используется компенсация движения. Оцениваетсяскорость перемещения движущихся объектов от кадра к кадру и при определениипредсказания производится соответствующая коррекция в положении опорногоизображения, по отношению к которому находится ошибка предсказания. Определениевеличины и направления смещения движущихся объектов от кадра к кадру,называемого вектором движения, производится на уровне макроблока. Оценкавектора движения — сложная процедура, требующая больших вычислительныхмощностей. Именно она определяет асимметрию кодека MPEG-2. Однако стандарт нерегламентирует процедуру оценки вектора движения, поэтому в этой областиведутся серьезные работы, благодаря использованию результатов которых практическаяасимметрия кодека в будущем будет минимизироваться. Стандарт MPEG-2 (в отличиеот JPEG и DV) предполагает устранение не только пространственной, но ивременной избыточности. Что же это дает? Представим себе группу из 12изображений со следующей структурой – I-B-B-P-B-B-P-B-B-P-B-B. После компрессииобъем изображений типа P для типичных сюжетов вещательного телевидения будетсоставлять примерно 35% объема изображения типа I, а B-изображения – примерно25%. Объем данных, которые после компрессии представляют всю группу из 12изображений, будет равен 4 изображениям типа I. Но если бы не было сокращениявременной избыточности, то необходимый объем данных был бы в 12/4=3 разабольше. Этот коэффициент (3) и дает уменьшение скорости потока данных,достигаемое за счет использования компрессии MPEG-2 с группами из 12изображений, при приблизительно такой же заметности искажений компрессии. Чембольше группы изображений, тем больше выигрыш, обеспечиваемый за счетустранения временной избыточности. Правда, надо отметить, что в случаеприменения систем компрессии типа JPEG или DV не было бы артефактов, связанныхс движущимися объектами, но, с другой стороны, в системе MPEG-2 глаз замечаеттакие искажения тем меньше, чем быстрее движутся объекты в поле изображения.Как видно, эти два фактора в какой-то мере компенсируют друг друга. Можнокорректировать величину выигрыша, но то, что этот выигрыш значителен, неподлежит сомнению, поэтому применение компрессии MPEG-2 с устранением временнойизбыточности, конечно, целесообразно во всех звеньях тракта, где желательноуменьшение скорости потока данных.

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">

НАУ.ІСПР.24391.03.07.05

Вим  Стор.    №  документу   Підпис      Дата

Стор.

7

<img src="/cache/referats/24420/image015.gif" v:shapes="_x0000_s1158 _x0000_s1159 _x0000_s1160 _x0000_s1161 _x0000_s1162 _x0000_s1163 _x0000_s1164 _x0000_s1165 _x0000_s1166 _x0000_s1167 _x0000_s1168 _x0000_s1169 _x0000_s1170 _x0000_s1171 _x0000_s1172 _x0000_s1173 _x0000_s1174 _x0000_s1175 _x0000_s1176 _x0000_s1177 _x0000_s1178 _x0000_s1179 _x0000_s1180 _x0000_s1181 _x0000_s1182 _x0000_s1183"><span Arial",«sans-serif»">Режимы кодера

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">Возможны два основныхрежима работы кодера компрессии – с постоянной скоростью потока данных и спостоянным уровнем качества декодированного изображения. Возможность для управлениястепенью компрессии и скоростью потока данных предоставляет изменениепараметров матрицы квантования: чем более грубое квантование, тем большенулевых значений в матрице коэффициентов и тем меньше объем данных, необходимыхдля передачи информации об изображении. Однако с увеличением степени компрессиирастут и необратимые искажения изображения из-за шумов квантования. В режиме спостоянным качеством используется фиксированная матрица квантования. Но приэтом скорость потока компрессированных данных является переменной. Чем большедетальность изображения, чем быстрее перемещается объект в поле изображения,тем больше количество ненулевых коэффициентов в матрице коэффициентовкосинусного преобразования, тем больше объем данных и тем больше скоростьпотока. Такой режим можно использовать при записи компрессированных потоковвидеоданных на дисковые накопители в условиях отсутствия ограничений на объемзаписанных данных. Однако при этом возможны ограничения на скоростьзаписываемого потока, ведь она не может быть произвольно большой. В режиме спостоянной скоростью потока данных в кодере осуществляется непрерывное изменениекоэффициентов матрицы квантования. Чем мельче детали, чем более динамичноизображение, тем более грубое квантование вводится в кодере для того, чтобыпривести к заданной величине скорость потока. Это означает, что вдекодированных изображениях с большим количеством быстро движущихся мелкихдеталей будет больше искажений и артефактов из-за шумов квантования, чем в статичныхизображениях с крупными структурными элементами. Такой режим используется всистемах передачи компрессированных изображений по каналам связи сфиксированной пропускной способностью, в системах цифрового спутникового,кабельного и наземного телевизионного вещания. Если запись компрессированногопотока видеоданных производится не в условиях реального времени, то можноиспользовать и другие варианты управления скоростью потока данных. Например,можно выполнять компрессию в два прохода. На первом проходе находятся параметрыкомпрессии, обеспечивающие максимальное качество при фиксированном объемедискового пространства. На втором – производится компрессия с найденнымипараметрами. Есть еще одна возможность улучшения качества при записи фрагментовпрограммы с быстро перемещающимися объектами. На стадии предварительногопросмотра оператор может найти такие интервалы и пометить их с цельюпринудительного размещения в них изображений типа I, что позволяет улучшитькачество при кодировании таких «трудных» для компрессии сцен. Эти методыиспользуются при записи программ и фильмов на диски DVD.

<span Arial",«sans-serif»">Порядок передачи изображений вэлементарном потоке

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">В результатекомпрессии объем данных, представляющий исходные изображения, сжимается(рис.7). Но стандарт MPEG-2 не регламентирует сам процесс кодирования, поэтомуизображения (блоки представления) в нем рассматриваются как результатдекодирования компрессированных изображения – блоков доступа. Использованиедвунаправленного предсказания приводит к тому, что декодер может приступить кдекодированию изображения типа B только после того, когда уже получены и декодированыи предшествующее, и последующее опорные изображения, с помощью которых вычислялосьпредсказание. Для того, чтобы не устанавливать в декодере огромные буферные массивы,в потоке данных на выходе кодера (этот поток называется элементарным потокомвидеоданных) кодированные изображения следуют в порядке декодирования.Например, вместо последовательности I-B-B-P формируется серия I-P-B-B (рис.8).

<img src="/cache/referats/24420/image016.jpg" v:shapes="_x0000_i1029">

<img src="/cache/referats/24420/image017.jpg" v:shapes="_x0000_i1030">

НАУ.ІСПР.24391.03.07.05

Вим  Стор.    №  документу   Підпис      Дата

Стор.

8

<img src="/cache/referats/24420/image018.gif" v:shapes="_x0000_s1184 _x0000_s1185 _x0000_s1186 _x0000_s1187 _x0000_s1188 _x0000_s1189 _x0000_s1190 _x0000_s1191 _x0000_s1192 _x0000_s1193 _x0000_s1194 _x0000_s1195 _x0000_s1196 _x0000_s1197 _x0000_s1198 _x0000_s1199 _x0000_s1200 _x0000_s1201 _x0000_s1202 _x0000_s1203 _x0000_s1204 _x0000_s1205 _x0000_s1206 _x0000_s1207 _x0000_s1208 _x0000_s1209"><span Arial",«sans-serif»">Профили и уровни MPEG-2

<span Arial",«sans-serif»">

<span Arial",«sans-serif»">Стандарт MPEG-2определяет кодирование, охватывающее требования широкого круга приложений сферыпроизводства и распределения телевизионных программ. Обобщение требований типичныхи наиболее важных приложений и определило синтаксис и семантику потокавидеоданных. Но для наиболее эффективного применения на практике и обеспечениявысокой степени эксплуатационной совместимости устройств, работающих в рамкахстандарта MPEG-2, но разработанных и изготовленных различными производителями,в рамках синтаксиса MPEG-2 выделено несколько подмножеств, называемыхпрофилями. Но и в рамках синтаксических границ каждого профиля может быть огромноеколичество комбинаций параметров цифрового потока. Поэтому в каждом профилевыделено несколько уровней, определяемых совокупностью ограничений, наложенныхна параметры цифрового потока, подчиняющегося синтаксису профиля. Другимисловами, профиль — это подмножество стандарта для специализированногоприменения, задающее алгоритмы и средства компрессии. Уровни внутри каждогопрофиля связаны главным образом с параметрами компрессируемого изображения(таблица 1).
Профили MPEG-2: Simple — простой профиль; Main — основной профиль; SNR — профиль с масштабируемым квантованием (SNR — Signal-to-Noise-Ratio — отношениесигнал шум); Spatial — профиль с масштабируемым пространственным разрешением(spatial — пространственный); High — высокий профиль; 422 — студийный профиль.Профиль с масштабируемым квантованием SNR поддерживает все типы изображений. Набазовом уровне кодера используется обычное кодирование на основе предсказания скомпенсацией движения, дискретного косинусного преобразования и квантования ошибкипредсказания. Выходные данные этого кодера образуют нижний, или базовый слойцифрового потока данных. Ошибка квантования, обусловленная квантователем,кодируется (с использованием второго квантователя и кодера с переменной длинойслова) и передается в качестве верхнего слоя цифрового потока. На приемнойстороне производится либо декодирование одного базового слоя, что обеспечиваетприемлемое качество, либо обоих слоев, что позволяет уменьшить шумыквантования. Профиль с масштабируемым пространственным разрешением Spatialтакже использует все виды изображений. Цифровой поток структурирован и имеетбазовый и дополнительные слои. Профиль позволяет иметь наряду с базовымпространственным разрешением и более высокие значения, если декодировать всеслои цифрового потока. Студийный профиль 422 обеспечивает полное разрешение,соответствующее рекомендации ITU-R 601, монтаж с точностью до кадра, допускаетмногократные перезаписи. Надо иметь в виду, что в таблице показаны максимальнодостижимые значения параметров, а не их сочетания. Например, в рамках основногоуровня профиля 422 количество активных строк равно 608 для системы разложения625 строк/25 кадров и 512 – для 525 строк/30 кадров. К настоящему времени лишьчасть из возможных сочетаний профилей и уровней достаточно разработана ипринята в качестве стандарта.

<span Arial",«sans-serif»;color:black">

<span Arial",«sans-serif»">Пакетный элементарный поток

<span Arial",«sans-serif»;color:black">

<span Arial",«sans-serif»">Системная спецификацияMPEG-2 (ISO/IEC 13818-1) описывает объединение элементарных потоков одной илинескольких телевизионных программ в единый поток данных, удобный для записи илипередачи по каналам цифровой связи. Надо отметить, что стандарт MPEG-2 неопределяет защиту от ошибок, возможных при записи или передаче, хотя он,конечно, предусматривает такую возможность, облегчая защиту за счетоптимального выбора параметров потока. MPEG-2 регламентирует две возможныхформы единого потока данных – это программный поток и транспортный поток.Первый шаг на пути получения единого потока — формирование пакетногоэлементарного потока PES (Packetised Elementary Stream), представляющего собойпоследовательность PES-пакетов (рис.9). Каждый пакет состоит из заголовка иданных пользователя, или полезной нагрузки, которая представляет собойфрагменты исходного элементарного потока. Нет никаких требования посогласованию начала полезных данных пакета и начала блоков доступа, поэтомуначало блока доступа может быть в любой точке PES-пакета, а несколько малыхблоков доступа могут попасть в один PES-пакет. PES-пакеты могут быть переменнойдлины. Эту свободу можно использовать по-разному. Например, можно просто установитьфиксированную длину всех пакетов, а можно согласовывать начало пакета с началомблока доступа.

НАУ.ІСПР.24391.03.07.05

Вим  Стор.    №  документу   Підпис      Дата

Стор.

9

<img src="/cache/referats/24420/image019.gif" v:shapes="_x0000_s1210 _x0000_s1211 _x0000_s1212 _x0000_s1213 _x0000_s1214 _x0000_s1215 _x0000_s1216 _x0000_s1217 _x0000_s1218 _x0000_s1219 _x0000_s1220 _x0000_s1221 _x0000_s1222 _x0000_s1223 _x0000_s1224 _x0000_s1225 _x0000_s1226 _x0000_s1227 _x0000_s1228 _x0000_s1229 _x0000_s1230 _x0000_s1231 _x0000_s1232 _x0000_s1233 _x0000_s1234 _x0000_s1235"><span Arial",«sans-serif»"><img src="/cache/referats/24420/image020.jpg" v:shapes="_x0000_i1031">

<span Arial",«sans-serif»">В начале заголовкаPES-пакета (рис.10) идет 32-битный код старта, состоящий из стартового префиксаи идентификатора потока. Идентификатор потока позволяет выделить PES-пакеты,принадлежащие одному элементарному потоку телевизионной программы. Спецификацияопределяет разрешенные значения чисел в поле идентификатора для 32 элементарныхпотоков звука и 16 элементарных потоков видеоданных. Флаги 1 и 2 – биты,указывающие на наличие или отсутствие в заголовке дополнительных полей, которыене являются обязательными. Эти поля служат для переноса дополнительнойинформации, такой, например, как авторские права, скремблирование, приоритет.Особую значимость имеют биты P и D флага 2, указывающие на наличие полей сметками времени представления PST (Presentation Time Stamps) и декодированияDTS (Decoding Time Stamps). Метки времени – это механизм, обеспечивающийсинхронизацию потоков данных в декодере.

<span Arial",«sans-serif»;mso-ansi-language:EN-US">

<span Arial",«sans-serif»;mso-ansi-language: EN-US">

<span Arial",«sans-serif»;mso-ansi-language: EN-US">

<span Arial",«sans-serif»;mso-ansi-language: EN-US">

<span Arial",«sans-serif»;mso-ansi-language: EN-US">

<span Arial",«sans-serif»;mso-ansi-language: EN-US">

<span Arial",«sans-serif»;mso-ansi-language: EN-US">

<span Arial",«sans-

еще рефераты
Еще работы по программному обеспечению