Реферат: Реферат объем документа


ЗАО "ЛАНИТ"


















ПОЯСНИТЕЛЬНАЯ ЗАПИСКА К ЛОКАЛЬНОМУ ПРОФИЛЮ СТАНДАРТИЗИРОВАННЫХ СПЕЦИФИКАЦИЙ АПО

Форматы представления данных для целей файлового обмена между программным обеспечением государственных информационных систем

Версия 0.2 от "12" октября 2005 г.

Разработана рабочей группой ___










2005

^ РЕФЕРАТ

Объем документа:

Страниц - . Таблиц – 12.

Ключевые слова:

АРХИТЕКТУРА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ, ФАЙЛ, ФОРМАТ, ИНТЕГРАЦИЯ, ОТКРЫТЫЙ СТАНДАРТ, ЛОКАЛЬНЫЙ ПРОФИЛЬ, ИНФОРМАЦИОННЫЙ ОБМЕН, ЭЛЕКТРОННЫЙ ДОКУМЕНТ, ГРАФИЧЕСКИЙ ФОРМАТ, РАСТРОВАЯ ГРАФИКА, ВЕКТОРНАЯ ГРАФИКА, АУДИОВИЗУАЛЬНОЕ ПРОИЗВЕДЕНИЕ, КОДЕК, ВИДЕОКОНТЕЙНЕР, МЕТАЯЗЫК.

^ Текст реферата:

Объектом разработки в рамках исследования является Локальный профиль представления данных для целей файлового обмена межу программным обеспечением государственных информационных систем, являющийся частью Главного профиля АПО. Профиль определяет стандарты форматы для наиболее общих и распространенных типов данных.

Целью работы является определение области применения, структуры профиля, типов данных для которых при файловом обмене должны использоваться стандартизованные спецификации, а также выбор конкретных спецификаций, определяющие форматы файлов для этих типов данных.

Структура профиля была определена экспертным путем. Предварительный отбор спецификаций осуществлялся путем анализа и сопоставления рекомендаций зарубежных нормативно-технических документов, аналогичных по назначению разрабатываемому профилю (SAGA и eGIF TSC). После этого проводился анализ спецификаций на соответствие критериям, установленным в проекте регламента ведения Главного профиля АПО. В случаях, когда предложенные в зарубежных источниках спецификации не удовлетворяли требованиям АПО, дополнительно рассматривались спецификации, принятые основными стандартизирующими организациями, определенными в Главном профиле АПО.

В результате работ был построен локальный профиль, описывающий стандартизованные спецификации для 30 основных типов и подтипов данных, используемых при файловом обмене.


СОДЕРЖАНИЕ



Введение. 4

Источники 4

Методика оценки 6

1 Состав и структура профиля 8

2 выбор спецификаций 8

.2.1 Общие спецификации 8

.2.1.1 Универсальный формат для представления данных. 8

.2.1.2 Кодировка символов 9

.2.1.3 Форматы агрегирования и компрессии 9

.2.2 Форматы текстовых документов 12

.2.3 Форматы представления двумерных статических изображений 16

.2.3.1 Растровая графика 16

.2.3.2 Векторная графика 18

.2.4 Форматы представления аудиовизуальных произведений и фонограмм 19

.2.5 Прочие форматы 22

.2.5.1 Электронные таблицы, презентации 22

.2.5.2 Анимация и интерактивность 22

Заключение 24
Введение.
Данная пояснительная записка является приложением к Локальному профилю файловых форматов и дает более подробную информацию о перечисленных в нем спецификациях, а также приводит обоснования их выбора (в т. ч. преимуществ перед значимыми альтернативными реализациями). Пояснительная записка не является частью локального профиля и не устанавливает каких-либо требований или условий по его использованию в рамках АПО. Во избежание дублирования информации в записке не приводятся окончательные решения, изложенные в Локальном профиле, а описываются только исходные данные для анализа и результаты рассмотрения спецификаций по отдельным критериям.

Рассмотрение спецификаций осуществлялось в порядке, предусмотренном Регламентом ведения Главного профиля АПО, поскольку локальные профили АПО являются частью Главного профиля.
Источники
Отбор спецификаций для рассмотрения выполнялся с учетом каталогов, принятых в Германии (SAGA) и Великобритании (eGIF TSC). При прочих равных предпочтение отдавалось форматам, имеющим обязательный статус в обоих документах. Такой подход к отбору спецификаций Указанные каталоги были выбраны как наиболее формализованные и стабильные документы такого рода, имеющихся в концепциях электронного государства разных стран. Для справки ниже приведены расшифровки статусов, принятых в соответствующих каталогах.

SAGA

Обозначение

Расшифровка

Значение

M

Mandatory

Обязательный

R

Recommended

Рекомендованный

U

Under observation

Перспективный (на рассмотрении)



eGIF TSC

Обозначение

Расшифровка

Значение

A

Adopted

Принятый (обязательный)

R

Recommended

Рекомендованный

U

Under review

Перспективный (на рассмотрении в настоящий момент)

F

For future consideration

Перспективный (предполагается рассмотреть в будущем)



^ Перечень спецификаций

Тип данных

Спецификация

SAGA

TSC

Типы файлов для текстовых документов

Text (.txt)

M

A

Hypertext Markup Language (HTML) 4.01 для рабочих станций

M

A

Hypertext Markup Language (HTML) 3.2 для прочих каналов




A

Portable Document Format (PDF) v1.3

M




Extensible Markup Language (XML)

R




Portable Document Format (PDF) v1.4

U

A

Rich Text Format as (.rtf) files




A

Word (.doc) viewer/reader for Windows 2000, Windows 95, Windows 98, Windows NT, with minimum support for Word97 format




A

Типы файлов для таблиц

Hypertext Markup Language (HTML)




A

Comma Separated Value (CSV)

M

A

Portable Document Format (PDF) v1.3

M




Portable Document Format (PDF) v1.4

U




MS Excel




A

Типы файлов для презентаций

Hypertext Markup Language (HTML)

M

A

Portable Document Format (PDF) v1.3

M




Portable Document Format (PDF) v1.4

U




Форматы обмена графикой

Graphics Interchange Format (GIF)

M

A

Joint Photographic Experts Group (JPEG)

M

A

Portable Network Graphics (PNG)

R

A

Tagged Image File Format (TIFF)

R

A

Масштабируемая векторная графика

Vector Graphics (.svg)




A

Vector Markup Language (vml)




A

Форматы обмена аудио и видео файлами

MPEG-1 Layer 3 (MP3)

MPEG-1/ISO 11172

M

A

Quicktime (.qt, .mov)

M




Windows Media Video (.wmv)

U




Hypertext Transfer Protocol (HTTP) v1.1

M




Apple Quicktime (.avi, .mov, .qt)

M

A

Ogg Vorbis

U

A

RealAudio/RealVideo (.ra, .ram, .rm, .rmm)




A

Macromedia Shockwave (.swf)




A

Windows media formats (.asf, .wma, .wmv)

U

A

Waveform Audio File Format (.wav)




A

ISO-MPEG Audio Layer-3 (.mp3)
Also published as:
ISO/IEC 11172-3:1993 and Co1:1996
^ ISO/IEC 13818-3:1998




A

8µ Law




A

H263




A

Speex




A

Анимация

Animated GIF

M




Macromedia Flash (.swf)




A

Apple Quicktime (.avi, .mov, .qt)




A

Macromedia Shockwave (.swf)




A

Архивирование данных

ZIP v2.0

M

A

GZIP v4.3

R

A

(.tgz), (.tar)




A



Помимо перечисленных в вышеприведенной таблице спецификаций, в рассмотрение был включен также ряд перспективных стандартов, выбранных экспертным путем их числа принятых для данной предметной области какой-либо из основных стандартизирующих организаций, определенных в приложении Б Главного профиля АПО. Как правило, дополнительные спецификации включались в рассмотрение в тех случаях, когда имеющихся в первичном списке спецификаций оказывалось явно недостаточно для покрытия предметной области профиля или они не в полной мере удовлетворяли предъявляемым к ним требованиям (см. ниже). Необходимость рассмотрения дополнительных спецификаций обосновывается в записке ниже в соответствующих разделах.
^ Методика оценки
Оценка спецификаций в соответствии с Регламентом осуществлялась в два этапа – по первичным требованиям открытости и по расширенным критериям (описание критериев см. в Регламенте). В некоторых случаях по усмотрению экспертов, а именно при отсутствии хороших альтернатив или при необходимости поддержки формата унаследованных систем, к расширенному рассмотрению принимались и спецификации, не в полной мере удовлетворяющие первичным требованиям по открытости АПО.

При окончательном отборе спецификаций для включения в профиль предпочтение отдавалось спецификации, набравшей наибольшее число плюсов по расширенным критериям, если только не обнаруживалось какого-либо блокирующего недостатка, делающего ее использование невозможным (как правило, по критерию полноты и соответствия). В том случае, если спецификация не в полной мере удовлетворяла требованиям по открытости, она включалась в Локальный профиль со статусом «выбывающей» или «рекомендованной».

Расширенная экспертиза соответствия выбранных спецификаций критериям АПО не проводилась в следующих случаях:

если необходимость применения данной спецификации прямо вытекает из требований АПО в целом и каталога спецификаций Главного профиля АПО в частности;

если спецификация, включенная в каталоги SAGA и TSC, удовлетворяет первичным требованиям, в достаточной степени покрывает предметную область локального профиля и не имеет очевидных альтернатив;

если функция (задача) профиля АПО, для которой выбирается спецификация, оказывается технологически зависимой от решений, принятых ранее для более важных или высокоуровневых задач профиля; так, например, с учетом того, что для информатизации офисной деятельности в настоящее время применяются в основном интегрированные пакеты программ, выбор определенного формата для текстовых документов общего назначения делает целесообразным использование аналогичных технологий для представления электронных таблиц, презентаций и др.

Все перечисленные случаи особо оговорены далее при рассмотрении соответствующих разделов профиля.
^ 1Состав и структура профиля
Для рассматриваемой задачи в АПО отсутствует эталонная функциональная модель, в связи с чем структура каталога спецификаций в профиле построена на основе экспертных оценок. Профиль предназначен на определение стека стандартизованных решений для задач повседневного информационного обмена, в основном в рамках документарного обеспечения управления, а также при представлении исполнителями результатов работ по госконтрактам, различной отчетности и т.п. Профиль не предполагается распространять на форматы файлового представления специальных видов данных (картографических, биометрических и т.п.), как правило, бинарных, для которых использование универсального представления на метаязыке неэффективно. Определение спецификаций для представления таких данных должно быть выполнено в рамках локальных профилей, описывающих стек стандартизованных решений соответствующих прикладных задач.

В профиле предлагается выделить следующие группы стандартизируемых спецификаций:

Общие спецификации. Раздел включает перечень спецификаций и форматов для представления структурированных данных на универсальном метаязыке, устанавливает требования к кодировке текстовых данных и способы сжатия и агрегации файлов.

Форматы текстовых документов (включая текстовые документы с визуальной разметкой и форматированием, содержащие иллюстрации и иные отличные от текста вставные материалы).

Форматы представления двумерных статических изображений (растровых и векторных).

Форматы представления аудиовизуальных произведений и фонограмм (мультимедийные форматы).

Прочие форматы, не подпадающие под определения предыдущих групп.
^ 2выбор спецификаций .2.1Общие спецификации .2.1.1Универсальный формат для представления данных.
Выбор универсального формата представления данных диктуется общими принципами, положенными в основу Архитектуры программного обеспечения электронного государства и устанавливающими XML в качестве метаязыка для межсистемного взаимодействия.

Универсальный формат представления данных должен использоваться во всех системах, предусматривающих обмен файлами, если только для передаваемых данных в профиле для них не предусмотрен специфический формат, и если они не подпадают под категорию специальных данных, форматы которых должны определяться в других профилях. При этом предполагается, что при выборе специальных форматов предпочтение также по возможности будет отдаваться стандартизованным спецификациям на основе XML.

Конкретные схемы данных в XML-файлах должны определяться разработчиками соответствующих систем исходя из практических потребностей, однако общим требованием при этом является обязательное документирование разработанных форматов с помощью формального языка описания схем, также основанного на XML. Помимо формального описания XML Schema разработчик в проектной документации должен раскрывать и семантическую составляющую разработанного формата (смысл всех полей, атрибутов и параметров) в объеме, достаточном для независимой интерпретации и обработки представленных в файле данных.
^ .2.1.2Кодировка символов
Допустимая кодировка текстовых символов определяется в Главном профиле АПО и в Локальном профиле файловых форматов приводится в основном в справочных целях, а также для того, чтобы обеспечить полноту предложенного стека спецификаций до момента официального принятия Главного профиля АПО.

Выбор UNICODE диктуется необходимостью поддержки многоязыкового представления документов и устранения противоречий в многочисленных несовместимых кодировках кириллицы, установленных в ГОСТ и используемых на различных платформах. Восьмибитовое представление UTF-8 выбрано с учетом ее фактической распространенности и поддержки рынком. Выбранная кодировка принята в качестве стандарта ISO и удовлетворяет всем требованиям открытости.
^ .2.1.3Форматы агрегирования и компрессии
Данная группа спецификаций предназначена для решения следующих задач:

Агрегирования не связанных между собою файлов, т.е. представления их в виде файла, который может храниться и пересылаться по сетям связи в виде единого целого, а при необходимости из него могут быть извлечены исходные файлы (все или по отдельности), в т.ч. с сохранением их взаимного расположения в рамках файловой системы (в структуре папок/каталогов). Отметим, что данная задача не выделена четко в каталогах SAGA и eGIF TSC, хотя спецификации, обеспечивающие ее решение, косвенно упомянуты.

Компрессии (сжатия) данных. В настоящее время в связи с резким снижением стоимости хранения данных на машинных носителей, а также в связи с распространением специализированных алгоритмов компрессии для мультимедийной информации, задача универсальной файловой компрессии сохраняет актуальность главным образом при пересылке данных по сетям связи. Технологически задача компрессии обычно тесно связана с агрегированием, на практике многие (но не все) представленные на рынке форматы позволяют решать обе задачи одновременно.

В качестве форматов агрегации рассматривались две спецификации, удовлетворяющие требованиям по открытости, зрелости и распространенности:

Образ файловой системы ISO 9660:1988. Изначально создавался как формат файловой системы для оптических носителей, но может быть использован и в других областях. Формат накладывает довольно существенные ограничения на структуру агрегируемой файловой системы в области длины имён файлов и каталогов, а также используемого набора символов. Возможности сохранения в этом формате различных атрибутов файлов также ограничены. Для преодоления этих ограничений используются различные расширения, так в операционных системах компании Microsoft обычно используется расширение Joilet а в POSIX-совместимых операционных системах – расширение Rock Ridge. Однако в связи с тем, что статус первой спецификации четко не определен, а вторая недостаточно поддержана на уровне настольных платформ, использование расширений рекомендуется только в качестве дополнения к основному стандарту, в обоснованных случаях по усмотрению госзаказчиков. Порядок использования расширений предполагается уточнить в последующих версиях профиля.

Tape Archive (TAR). Входит в стандарт POSIX.1-2001. Формат удовлетворяет всем требованиям к открытости и имеет достаточно широкое распространение (особенно в POSIX-совместимых операционных системах). Имеется значительное число реализаций. Будучи первоначально разработан для агрегации файлов при записи на магнитную ленту, формат недостаточно эффективно обеспечивает прямой доступ к объединённым файлам, что, однако, не препятствует его использованию в целях, предусмотренных профилем.

Сопоставление форматов по расширенным критериям не проводилось, так как области применения указанных спецификаций не полностью пересекаются. Исходя из функциональных возможностей форматов, предложено включить их в профиль оба в статусе рекомендованных.

В качестве основных форматов компрессии на основании зарубежного опыта рассматривались следующие спецификации:

ZIP. Формат не описан официально ни одной из организаций, занимающихся стандартизацией, но имеет чрезвычайно широкое применение в самых различных областях. Описание формата доступно на сайте компании PkWare1 и не меняется в течении длительного времени. Использование этого формата свободно от выплат. Формат ZIP используется в таких стандартах как Open Document, J2SE и многих других. Имеются многочисленные реализации, обладающие высочайшей совместимостью.

Gzip. Также как и ZIP, не относится к официально принятым стандартам, но имеет широчайшее распространение, в частности при передаче файлов по протоколу http. Так, все распространённые веб-браузеры умеют производить декомпрессию этого формата. В отличие от ZIP не является форматом агрегации, но лишь форматом компрессии. При необходимости, агрегация может быть выполнена отдельно, например, в формате TAR. Спецификация формата доступна2, формат удовлетворяет всем условиям открытости.

Поскольку ни один из указанных форматов не удовлетворяет требованиям АПО по открытости в полной мере (отсутствуют их официально опубликованные стабильные спецификации), были рассмотрены также другие представленные на рынке и практически используемые в России форматы компрессии:

RAR. Файлы, создаваемые одноимённой программой, разработанной компанией RARSoft3. Довольно широко распространены, особенно на территории бывшего СССР. Главным положительным свойством является высокая степень компрессии. Тем не менее, в связи с закрытостью формата RAR, он не может быть рекомендован для использования в системах, разрабатываемых в рамках электронного государства.

Microsoft Cabinet (CAB). Формат cab широко используется в последних версиях программного обеспечения компании Microsoft. Спецификация формата доступна, но, несмотря на это, существует только одна полноценная реализация. Вне своей ниши (распространение программного обеспечения в среде Microsoft Windows) формат практически не используется.

Bzip2. Является форматом компрессии, функционально сходным с Gzip, но, как правило, обеспечивающим большую степень сжатия. Удовлетворяет требованиям открытости, но из-за гораздо меньшей степени распространения и поддержки рынком не может быть рекомендован для использования в рамках электронного государства.

Ниже представлена сводная таблица оценки рассмотренных форматов по первичным критериям соответствия требованиям АПО.

Наименование

ZIP

GZIP

RAR

CAB

BZIP2

Стабильность

+/-

+/-

?

+

+

Доступность

+

+

-

+

+

Отсутствие ограничений

+/-

+

?

?

+

Отсутствие роялти

+

+

?

?

+

Здесь и далее в таблицах используются следующие условные обозначения:

+ - соответствует требованиям, имеет соответствующий показатель;

- - явно не соответствует требованиям (например, текст спецификации содержит прямое отрицание данного требования или условия);

? – информация недоступна или не позволяет вынести окончательное заключение (например, в тексте спецификации нет прямых ограничений на ее использование, однако и не установлен явно ее свободный статус, а практика использования говорит о возможных патентных проблемах);

+/- - частично соответствует требованиям (имеются отдельные положения, которые не вполне удовлетворяют требованию, но не противоречат ему);

* - используется для критериев оценки, рассматриваемых сравнительно (см. раздел 1), указывает на спецификации, имеющие наилучшие показатели по данному критерию по сравнению с прочими рассмотренными.

В следующей таблице приведен сравнительный анализ форматов и их спецификаций по основным критериям.

Наименование

ZIP

GZIP

RAR

CAB

BZIP2

Примечания

Полнота

+

+/-

+

+

+

См. описание форматов выше.

Соответствие содержания

+

+/-

+

+/-

+

Ориентация на открытые системы



+





+



Согласованность с принципами АПО

+

+





+

Форматы RAR и CAB являются частными

Отсутствие дискриминации и расширения требований

+

+

?

?

+

Зрелость

*









Все рассмотренные форматы являются стабильными и не предполагают существенного развития.

Современность









*

Перспективность











Рыночная поддержка

*

*







Формат компрессии GZIP используется в протоколе HTTP

Практическое использование

*

*







Наличие свободных реализаций

+

+

-

-

+



Адаптивность и гибкость

+

-

+



+



Как видно из таблицы, ни один из дополнительно рассмотренных форматов компрессии также не удовлетворяет всем требованиям АПО, в связи с чем было принято решение сохранить в Локальном профиле форматы ZIP и GZIP, придав им статус рекомендованных.
^ .2.2Форматы текстовых документов
Под текстовыми документами в данном разделе понимаются все виды документов без строгой структуры, при этом предполагается, что некоторые документы могут включать также иллюстрации, таблицы, сведения о внешнем оформлении текста, шрифтах и т.п. В разделе выделяются следующие виды документов в зависимости от их основного назначения:

Формат представления документов для последующей обработки (редактирования). Основной формат обмена текстовыми документами, предполагающий возможность использования универсальных текстовых процессоров с развитыми средствами редактирования и форматирования. Должен обеспечивать, как минимум:

Возможность задания шрифтов, начертаний, стилей основных структурных элементов документа, выравнивания абзацев и иных параметров оформления.

Возможность представления документа для печати путем задания логических параметров вывода страниц – формата бумаги, взаимного расположения абзацев, колонтитулов и т.п.

Возможность включения в текст иллюстраций, таблиц, элементов автоматизации (оглавлений, индексов, автонумерации страниц и т.п.).

Возможность включения в файл метаданных документа.

Возможность отслеживания и сохранения исправлений.

Независимый от устройства вывода формат для представления документов с сохранением разметки страниц (аппаратно-независимый формат, формат для печати). Должен обеспечивать задание точных физических параметров вывода страниц. Применяется:

Для документов, которые по юридическим основаниям должны представляться в виде твердой (бумажной) копии, т.е. когда юридически значимым является постраничная разбивка текста и расположение на страницах иных содержательных элементов (иллюстраций, колонтитулов и т.п.), которое не может быть обеспечено средствами формата обработки.

Для документов, где значимым является точное взаиморасположение (верстка) содержательных элементов, которое невозможно обеспечить средствами формата для обработки (чертежи и схемы, сложные таблицы, руководства пользователей и учебные материалы, макеты книг и т.п.).

В зарубежных источниках для представления текстовых документов указаны следующие форматы:

PDF (Portable Document Format). Разработчиком является компания Adobe4, в качестве стандарта де-юре принят ISO (ISO 15930-5:2003 - PDF/X-2). Документы в формате PDF имеют одинаковый вид как при печати, так и при отображении на экране мониторов вне зависимости от разрешающей способности (разумеется, при правильной реализации формирующей и отображающей программы). При этом обеспечивается корректное сохранение разметки страниц, взаимного расположения текстовых и графических элементов документа. Документы в формате PDF успешно индексируются поисковыми системами в Интернете. Формат ориентирован преимущественно на предпечатную подготовку документов. Его использование для представления при редактировании документов затруднено (практически невозможно) в связи с тем, что формат оперирует такими низкоуровневыми понятиями, как строка символов, отображаемая тем или иным шрифтом, линия и т.д. в противовес таким понятиям, как абзац, заголовок, колонтитул. Ограничены также возможности по использованию в документах интерактивных и мультимедийных элементов. В связи с этим в дальнейшем данный формат рассматривается только как аппаратно-независимый формат.

HTML различных версий (стандарт W3C). Формат сам по себе не обеспечивает представления документов для печати, однако может использоваться для работы с гипертекстовыми документами, предназначенными исключительно для использования в электронной форме.

Форматы файлов текстового процессора Microsoft Word (.doc). Формат является закрытым, официальные спецификации отсутствуют, легальное использование формата ограничено решениями единственного поставщика. Однако с функциональной точки зрения формат удовлетворяет всем требованиям, предъявленным к формату для обработки, а большое количество унаследованных документов MS Word диктуют необходимость его поддержки в статусе выбывающего.

Rich Text Format (RTF). Разработан фирмой Microsoft как переносимый формат для обмена документами между текстовыми процессорами различных производителей. Спецификация формата доступна5, но её поддержка и развитие является исключительно в компетенции разработавшей его компании. В связи с этим формат не может быть оценен, как стабильный, кроме того, существует несколько ограниченно совместимых версий формата, что делает его малоприменимым для полноценного обмена информацией. Формат в значительной степени человекочитаем, однако встроенные объекты хранятся в кодировке base646. Поскольку RTF разрабатывался для текстового представления документов Microsoft Word, им унаследовано большое количество особенностей старых версий двоичного формата этого текстового процессора. Формат в настоящее время не развивается, и в целом не может быть оценен, как перспективный и современный. В то же время он широко поддержан рынком и является единственным открытым способом обмена документами с текстовым процессором Microsoft Word.

Сводная оценка соответствия форматов первичным критериям приведена в таблице.

Наименование

PDF

RTF

.doc

Стабильность

+

-

-

Доступность

+

+

-

Отсутствие ограничений

+/-

-

-

Отсутствие роялти

+

+/-

-

В связи с тем, что форматы RTF и .doc не удовлетворяют первичным требованиям, формат PDF не может быть использован в качестве основного формата для обработки, а формат HTML – для аппаратно-независимого представления, в список для расширенного рассмотрения был дополнительно включен формат Open Office XML Основан на формате, используемом текстовым процессором из пакета OpenOffice.org7.

Формат обеспечивает полноценный и традиционный для текстовых процессоров общего назначения (таких как Microsoft Word) набор выразительных средств. Формат полностью открыт, свободен от лицензионных выплат и, кроме того, удобен для обработки в автоматизированных системах, не являющихся текстовыми процессорами и даже не имеющих пользовательского интерфейса.

Файл в этом формате представляет собой набор файлов, запакованных в архив формата ZIP8. В архиве находятся несколько XML файлов, описывающих содержание и оформление документов и различные включённые объекты, такие как графические файлы в стандартном формате. Для передачи визуального форматирования используется подмножество атрибутов стандарта XSL-FO, для передачи математических формул - MathML9, для векторной графики — SVG10, для связей между частями документа - XLink11. Таким образом, формат удовлетворяет общим принципам АПО и совместим с общими спецификациями данного локального профиля (см. предыдущий раздел).

На данный момент доступна одна полная (OpenOffice.org) и несколько частичных реализаций стандарта. Формат оценивается экспертами, как чрезвычайно перспективный, однако недостаточная поддержка рынком не позволяет принять его в качестве единственного основного формата.

Общие результаты расширенного сопоставления рассматриваемых спецификаций приведены в таблицы.

Наименование

PDF

RTF

.doc

OO XML

HTML

Примечания

Полнота

+

+/-

+

+

+

Формат PDF рассматривался только для аппаратно-независимого представления.

Соответствие содержания

+/-

+/-

+/-

+

-

Ориентация на открытые системы

-

-

-

+

+



Согласованность с принципами АПО

+

-

-

+

+



Отсутствие дискриминации и расширения требований

-

+

-

+

+

Зрелость

*







*



Современность







*



Перспективность







*



Рыночная поддержка

*







*



Практическое использование





*





Наличие свободных реализаций

+/-

+/-

-

+

+



Адаптивность и гибкость

-

-

-

+

+/-



С целью обеспечения полноты стека спецификаций в локальный профиль также включены (без расширенного рассмотрения):

Формат гипертекстового документа для использования в веб-приложениях и связанный с ним формат описания визуального представления элементов гипертекстовых документов. Выбор спецификаций для данных задач диктуется общими принципами АПО и Главным профилем АПО, а также требованиями по технологической совместимости с широко используемыми веб-браузерами. Поскольку задача разработки переносимых гипертекстовых документов имеет свою специфику по сравнению с задачей разработки веб-интерфейсов, в профиле предложено наложить определенные ограничения на HTML (см. п. 4.3. Локального профиля).

Поскольку все большее количество распространенных браузеров обеспечивает поддержку XML-представления гипертекстовых документов, в ходе будущего совершенствования АПО в целом и локального профиля в частности, данный раздел предполагается пересмотреть вплоть до полного отказа от использования связки HTML/CSS в пользу XML (в сочетании с тем или иным удовлетворяющим критериям АПО механизмом трансформации для целей представления).

Формат представления сканированных документов без распознавания текста. С технологической точки зрения данный тип данных является разновидностью двумерного статического изображения, в связи с чем для их представления принята удовлетворяющая требованиям назначения спецификация из соответствующего раздела локального профиля (см. ниже), а именно формат TIFF, допускающий многостраничное представление сканированных документов (т.е. размещение нескольких изображений в одном файле-контейнере).
^ .2.3Форматы представления двумерных статических изображений .2.3.1Растровая графика
Рассматриваемые источники в точности отражают сложившуюся на рынке ситуацию, когда для различных подзадач представления растровой графики практически монопольно используется один из четырех включенных в каталоги форматов, перечисленных в таблице ниже. Сопоставление функциональных возможностей форматов показывает, что прямая конкуренция возникает только у форматов GIF и PNG – последний был разработан, как замена первому и продвигается в этой роли консорциумом W3C.

В структуре профиля соответственно выделены следующие области применения этих форматов:

Растровые двумерные статические изображений, в т.ч. для интерфейсов веб-приложений.

Фотографии и иные полутоновые изображения, допускающие компрессию с потерей качества.

Растровые изображения в высоком разрешении без потерь качества (в т.ч. для целей предпечатной подготовки).

Наименование

GIF

JPEG

PNG

TIFF

Стабильность

+

+

+

+

Доступность

+/-

+

+

+

Отсутствие ограничений

+

+/-

+

+/-

Отсутствие роялти

+

+/-

+

+/-

В целом все рассмотренные форматы удовлетворяют первичным критериям АПО, хотя для некоторых возможностей JPEG и TIFF существуют патентные ограничения в некоторых странах. Кроме того, формат GIF рассматривается основными стандартизирующими организациями, как выбывающий, в связи с чем получение его текущей официальной версии сопряжено с некоторыми трудностями.

Сравнение форматов по расширенным критериям приведено в следующей таблице.

Наименование

GIF

JPEG

PNG

TIFF

Примечания

Полнота

+

+

+

+

Каждый их форматов имеет определенные преимущества в своей области применения

Соответствие содержания

-

+

+

+

Ориентация на открытые системы

-

-

+

-



Согласованность с принципами АПО



+

+

+



Отсутствие дискриминации и расширения требований

+

+/-

+

+/-

Зрелость

+

+

+

+



Современность

-

+

+

+

Перспективность

-

?

+

?

Рыночная поддержка

+

+

+

+



Практическое использование

+

+

+

+

Наличие свободных реализаций

+

+/-

+

+/-

Для некоторых возможностей JPEG и TIFF существуют патентные ограничения в некоторых странах.

Адаптивность и гибкость





*





Спецификации основных рассмотренных форматов имеют следующие особенности:

Формат Portable Network Graphic был разработан для преодоления недостатков формата GIF: как технических, связанных с недостаточным количеством одновременно отображаемых цветов так и юридических, связанных с внезапно возникшей необходимостью лицензионных выплат за использование формата. Является стандартом ISO и W3C, свободен от лицензионных выплат. Существует весьма значительное количество программных средств для работы с файлами в этом формате, в т.ч. свободно распространяемыми. Файлы в формате PNG корректно отображаются всеми современными браузерами и широко распространены в сети Интернет.

Graphic Interchange Format является одним из старейших широко используемых сегодня графических стандартов и имеет существенные ограничения возможностей. В частнос
еще рефераты
Еще работы по разное