Реферат: E-mail: Djavdet. Suleymanov@ksu


Аналитический обзор отечественных и зарубежных работ обработки естественного языка в аспекте прагматически-ориентированного подхода


Сулейманов Д.Ш., Казанский госуниверситет

e-mail: Djavdet.Suleymanov@ksu.ru


Введение.


Компьютерное моделирование языковой деятельности человека является одной из базовых проблем в области построения интеллектуальных систем, имеющей богатую предысторию и, возможно, столь же далекую от своего полного решения, как и в начале исследований. Такие задачи, как компьютерная обработка больших массивов естественно-языковых текстов (ЕЯ-текстов), естественно-языковое взаимодействие системы с пользователем, создание больших банков информации на основе естественных языков (ЕЯ), разработка языков посредников в многоязычной информационной среде, приобретают особую актуальность в связи с развитием глобальных компьютерных сетей и формированием больших объемов распределенных данных.

Несмотря на обилие научной и технической литературы, посвященной описанию лингвистических процессоров, от узкоспециализированных до универсальных, ни одна из приведенных задач в настоящее время, практически, не имеет удовлетворительного решения, ни одна из программ человеко-машинного интерфейса, машинного перевода или запроса к базе данных не может претендовать на полное и окончательное решение этих проблем. И причина здесь, как нам представляется, главным образом в том, что, во-первых, как правило, модели строятся не «от задачи», а «от языка», и, во-вторых, реальность всегда оказывается сложнее, нежели предполагается вначале, сколь бы подробно ни описывалась модель языка. Построение лингвистических моделей исходило изначально из сомнительного утверждения, что «для того, чтобы допускать возможность реальной компьютерной реализации, лингвистическая теория должна обладать высокой степенью формализации и полноты», т.е. делалась попытка построить идеальную инструментальную систему обработки ЕЯ, основанной на идеальной лингвистической теории [100]. Попытка найти решение через создание новых формализмов, ориентированных на описание лингвистических феноменов (морфологии, синтаксиса, семантики и др.), после каждой неудачи с предыдущими моделями, привела к большому многообразию лингвистических моделей, практически, различающихся только набором средств описания лингвистических феноменов, но не результативностью.

Как нам представляется, решение проблемы построения естественно-языковых лингвистических моделей и создания на их основе эффективных лингвопpоцессоpов, лежит не столько в области создания полных описаний ЕЯ (даже если это было бы возможно гипотетически), сколько в области концептуального осмысления подхода к построению лингвистической модели как к неотъемлемой части системы, составляющей единое целое вместе со всеми участниками обработки текста. Таким подходом, как мы считаем, является четкое базирование модели на прагматике системы, объединяющей всех участников вокруг целевой обработки ЕЯ-текста. Под участниками обработки текстов имеются ввиду все привлекаемые ресурсы и субъекты, включая обрабатываемый текст на ЕЯ, пользователя, нелингвистические блоки системы, проблемную область, контекст и т.п.

Лингвистические модели - это, по сути, фундаментальная научно-прикладная область исследований, помогающая строить системы, которые обрабатывают естественно-языковые тексты. Под обработкой ЕЯ-тестов понимается процесс взаимодействия Система-Текст-Пользователь, включающий различные способы воздействия на текст, такие как анализ, генерация, интерпретация, трансформация и др. Такое определение лингвистических моделей, основанное на их функциональном аспекте, является весьма полезным с методологической точки зрения, позволяющим провести соответствующую классификацию моделей по их прагматическим признакам, т.е. по цели разработки и сфере применения. Проведем следующее разбиение на классы лингвистических моделей:

1) когнитивные (семантико-контекстные) модели, обеспечивающие глубинное проникновение в текущий контекст и трансформацию его с сохранением смысла как внутри одной модели так и между разными моделями (например, системы машинного перевода, системы извлечения знаний);

2) диалоговые запросно-ответные или интерактивные модели, обеспечивающие естественно-языковой диалог автоматизированной системы с пользователем при запросах к системе или ответах пользователя на вопросы системы. Функция таких моделей, помимо анализа или син­теза ЕЯ-текстов, заключается в формировании корректного образа ответа на запрос и/или реакции на ответ пользователя;

3) концептуально-формальные модели, обеспечивающие целевую обработку текстов согласно соответствующих формальных правил определенного языкового уровня (собственно грамматики ЕЯ);

4) концептуально-функциональные модели, являющиеся наиболее полными описаниями определенного ЕЯ-уровня или уровней, обеспечивающими разработчиков структурно-функциональной, а также справочной информацией, необходимой при построении лингвопроцессоров.

Первые три класса моделей, главным образом, отличаются сложностью, т.е. количеством языковых уровней и связей между ними и средствами экстралингвистического описания. Самыми сложными, очевидно, являются модели, относящиеся к первому классу моделей, включающие наибольшее число различных взаимосвязанных языковых уровней, а также экстралингвистические описания, характеризующие особенности речевого акта, такие как модальность, неполнота, контекст, пропозиция, иллокутивные и коммуникативные особенности и др., и являющаяся наименее изученной и слабо описанной в настоящее время. Для моделей, относящихся к первому классу, определяющим является привлечение глубинных, когнитивных и семантических представлений, достаточно адекватно описывающих проблемную среду и контекстные проявления языка, не поддающиеся полной формализации. Наименее сложными, поддающимися максимальной формализации, но емкими и требующими максимальной полноты описания языкового уровня, являются модели, относящиеся к третьему классу моделей. Модели второго класса являются наиболее разработанными и представленными в экспериментальных и практических реализациях, занимая по сложности и определенности описаний серединную позицию между моделями первого и третьего классов. Главной отличительной особенностью моделей второго класса, т.е. диалоговых моделей, является то, что они обязательно содержат специальные блоки формирования образа ответа на запрос или реакцию на ответ. Лингвистические модели класса 4, практически, являются метамоделями по отношению к моделям других классов в том смысле, что они содержат “строительный материал”, т.е. концептуальное и функциональное описание единиц языковых уровней и их грамматик, из которых строятся модели трех первых классов. Из сказанного следует, что приведенная классификация не является вложенной, т.е. ни один из них не является частью другой. Каждый класс моделей определяется наиболее характерной и максимально полно описываемой в ней составляющей, что, естественно, не исключает подключения моделей из других классов при разработке лингвистических процессоров.

Под лингвистическим процессором (ЛП), как правило, понимается сумма автоматизированных средств переработки текстовой информации на естественном языке, в том числе и не рассчитанных на работу с ЕЯ в полном объеме [6]. Эффективность ЛП, включающих полный или ограниченный анализ морфологии, синтаксиса и семантики, как правило, достигается за счет существенных ограничений либо на язык, либо на проблемную область, либо на оба эти составляющие. Их можно назвать «усеченными моделями». Системы обработки информации, рассматриваемые в данной работе, основаны на прагматически-ориентированных моделях, наиболее полно учитывающих специфику классов задач, на решение которых они ориентированы.

Прагматически-ориентированные модели или модели от цели - это такие описания языка и процесса обработки естественно-языковых текстов, которые, в отличие от универсальных многоуровневых моделей с множеством связей, разработанных по принципу необходимости, включают минимальный набор средств, разработанный исходя из принципа достаточности для решения определенного круга задач. Такие модели строятся не за счет усечения тех или иных элементов языковых уровней универсальной лингвистической модели, а за счет установления целевых характеристик, изначально учитывающих достаточный набор языковых средств и детальность их описания исходя из методологических принципов «ожидаемости» и «контекстной управляемости».

Принцип «ожидаемости» в общем случае является основой выбора и предопределения инструментария (формальной базы и словарей) для обработки входного текста, в то время как принцип «контекстной управляемости» естественным образом «диктует» параметры входного текста - его содержание, форму, лексикон. Очевидно, контекстное управление является естественным для диалоговых моделей, когда один из участников взаимодействия, а именно тот, который обрабатывает текст, владеет инициативой. В случаях лингвистических моделей первого и третьего классов, как правило, тексты являются заданными и не зависящими от участника, обрабатывающего его, т.е. обрабатывающая сторона уже не является активной. Тем не менее, в силу того, что диалоговые модули, зачастую, в этих классах моделей используются в качестве служебных, принцип контекстной управляемости, хотя и опосредованно, здесь также имеет место. Благодаря принципу «ожидаемости», текст также становится активной стороной процесса обработки в рамках своей «компетенции», т.е. «заставляет» процессор «мобилизовать» целенаправленно те ресурсы, которые нужны для обработки текстов именно такого, определенного типа. Аналогично, «ожидаемость» определенной ситуации взаимодействия (текст для перевода, для извлечения знаний, диалоговый текст, текст для морфологической обработки и т.п.) также способствует минимизации и «опережающей» перегруппировке средств, привлекаемых для обработки текста. Таким образом, прагматический подход к построению лингвистических моделей это, прежде всего, концептуально-инструментальная технология, которая позволяет, с одной стороны, осуществлять адекватный подбор средств эффективной обработки ЕЯ-текста, с другой стороны, детерминировать контекст и направлять формирование ожидаемого ЕЯ-текста. Прагматика здесь проявляется и учитывается уже на уровне методологии, на уровне проектирования лингвистических моделей, а не только на уровне реализации, что, как правило, присуще проанализированным нами подходам к разработке систем обработки информации.

Прагматически-ориентированный подход устанавливает следующую технологию подбора необходимого “инструментария” (как процедурального так и декларативного) для построения лингвистического процессора:

а) прежде всего, определяется класс моделей, следовательно, максимальный набор лингвистических и внелингвистических средств, который необходим для решения указанной задачи в рамках моделей данного класса (классы моделей 1-4),

б) определяется режим взаимодействия пользователя с системой (пакетный, интерактивный, активна система - пассивен пользователь, пассивна система - активен пользователь и др.), следовательно, необходимый набор средств, определяющий схему диалога и поддерживающий данный режим,

с) определяется тип текста (текст для перевода с языка на язык, для перифраза, для извлечения знаний, вопрос-ответ, запрос-ответ, для морфологического анализа, морфологической коррекции и др.), следовательно, определяется минимальная часть средств, выбранных пунктом (а).

Очевидно, учет специфики выделенных классов моделей, а также возможная редукция и дифференциация средств внутри этих классов с учетом более тонких различий, позволяют повысить эффективность лингвопроцессоров, построенных на их базе.


1. Прагматически-ориентированный подход к разработке лингвистических моделей

1.1. Традиционный подход к анализу формальной базы систем обработки ЕЯ-текстов.


Имеется немало серьезных обзорных аналитических работ, посвященных предыстории, тенденциям развития ЕЯ-систем, средствам описания компьютерного представления и обработки лингвистической информации. К таким работам, достаточно полно характеризующим предысторию развития, современное состояние и тенденции в области обработки естественно-языковых текстов мы относим фундаментальные исследования Мальковского М.Г., Ronald A.Cole, А.С.Нариньяни, Шарова С.А., Попова Э.В., Дж.Слокум, Городецкого Б.Ю. [3, 29, 45, 51, 53, 125, 68, 100, 114]. При анализе тенденций развития работ в этой области исследователи, как правило, придерживаются схожей стратегической линии и выделяют следующие три подхода, отмечанных Мальковским М.Г. в [45, 47] как лингвистический, экспериментальный и прагматический.

Лингвистический подход характеризуется стремлением к использованию в ЕЯ-системах максимально полных моделей языка, к построению полностью явных, эксплицитных, описаний и к определению максимально адекватной общей структуры этих описаний. Соответствующие модели языка должны быть полными как с точки зрения ее объема (полнота охвата языковых средств, используемых в выбранных проблемных областях, естественность), так и с точки зрения ее общности, учета различных явлений и особенностей ЕЯ (лингвистическая обоснованность и выразительная мощность). Многие лингвистические описания не ориентированы на непосредственную машинную реализацию. Авторы лингвистических моделей зачастую явно или неявно апеллируют к языковой интуиции человека, носителя описываемого языка, опуская ряд «очевидных» деталей, чрезвычайно существенных при автоматической обработке текста.

Первыми формальными средствами, развитыми для описания языков, наиболее исследованными теоретически и имеющими широкое применение в практических приложениях, являются грамматики Хомского [41, 42, 97, 99, 113]. Поэтому вполне закономерно, что обзор развития лингвистической теории, включает, как правило, трансформационные грамматики Н.Хомского [12, 113], описывающих два уровня синтаксической структуры (глубинной и поверхностной), связанные посредством трансформаций, ставшие фундаментальной идеей для многих дальнейших исследований и реализаций; модель «Смысл <-> Текст» [6, 7, 49], в которой язык рассматривается как система кодов, соответствующей системе смыслов; а также наиболее популярную в настоящее время в компьютерной лингвистике современную модель Хомского GB, реализующую принцип ограничений на сформированность лингвистической структуры для описания грамматики. Идея генеративной грамматики Н.Хомского, "которая в своем современном виде включает в себя многие достижения функциональных теорий языка последних лет", и процесс их исторического развития подробно изложены Дж.Бейлин [12] в сборнике обзоров "Фундаментальные направления современной американской лингвистики" [97].

Однако грамматики Хомского, порождающие всевозможные правильные синтаксические конструкции, по мощности избыточны для анализа синтаксиса, и в то же время, недостаточны для установления семантических аспектов фразы на естественном языке. В связи с этим появились грамматики для анализа текстов, являющиеся модификацией или расширением КС-грамматик, позволяющие учитывать семантические признаки. К таким можно отнести и грамматические теории HPSG (Head-Driven Phrase-Structure Grammar) [138], в которой знак представляется как набор атрибутов различных уровней, позволяющий интегрировать всю лингвистически-релевантную информацию от фонологической до прагматической с одновременным ее использованием; SFG (Systemic Functional Grammar) [100], основным понятием которой является система как набор возможностей для некоторого грамматического признака; и LFG (Lexical functional Grammar) [137]. Попытка смоделировать понимание человеком семантически связанных текстов привела к постановке вопроса о семантических структурах в языке и об уровнях, на которых описываются значения слов, и построению экспериментальных систем обработки ЕЯ-текстов.

Экспериментальность подхода к построению лингвистических систем, как правило, используемый специалистами в области искусственного интеллекта, вызвана глобальностью и сложностью решаемых задач, необходимостью сокращения проблемной области и языка текста, попыткой глубокого проникновения в содержание ЕЯ-текста и рассматриваемого контекста, стремлением построить реально функционирующую эффективную систему. Привязанность к конкретным предметным областям означает отсутствие представления проблемно-независимой грамматики собственно ЕЯ даже в самом ограниченном понимании слова грамматика. Обзор экспериментальных систем обработки ЕЯ-текстов, как правило, содержит описание семантических падежей, семантических ролей, определяющих роли участников ситуации, управляемых предикатом; модели «семантик предпочтения» [59], рассматривающей смысл предложения не просто как список значений слов с соответствующей синтаксической структурой, а выделяющей структурированную форму сообщения, выражающую смысл предложения; модели концептуальной зависимости [101], предназначенной по замыслу авторов для описания модели мышления человека, характеризующейся преобладанием роли семантики и, практически, отсутствием привычных представлений синтаксиса и морфологии. Семантические структуры, соответствующие текстам на естественном языке, строятся на основании эвристического критерия, при котором главная роль отводится глаголам и предпочтение отдается семантическим категориям субъектов и объектов действий, то есть рассматривается логико-ситуационная роль слова в зависимости от его предметной прикрепленности в определенных ситуациях, свойственных обрабатываемым текстам. Такая интерпретация слов проста и удобна, поскольку позволяет получить о функциях слов, участвующих в каждом предложении, полную картину такого вида: кто, что делает, по отношению к кому, с кем, когда, где и т.д., в зависимости от того, какие роли существенны для выбранной языковой подсистемы. Это обеспечивает достаточно простую процедуру семантического анализа на логико-ситуационном глубинном уровне.

Естественно, такая обработка текста, основанная на упрощенной модели языка, позволяет игнорировать сложности синтаксиса и создает хорошие предпосылки построения достаточно реактивных анализаторов текста. Однако существующие модели, в основном, носят экспериментальный характер [1, 9, 24, 30] и, несмотря на многие положительные качества, неприемлемы для их прямого использования в прагматически-ориентированных лингвистических моделях, скажем, в таких как вопросно-ответных диалоговые модели, имеющие ряд выгодных особенностей по сравнению с универсальными моделями обработки ЕЯ-текстов (см. п.1.2.1.2 статьи).

Прагматические системы в литературе, как правило, ассоциируются с реальными системами, созданными для решения конкретного круга задач в узкой проблемной области (ПО), и достигающих высокой эффективности за счет ограниченности ПО, однозначности контекста и примитивности языкового интерфейса. При этом прагматика, т.е. нацеленность на результат, проявляется в процессе эксплуатации готовой системы пользователем.

Отдельного рассмотрения заслуживают работы последних лет Нариньяни А.С., отчасти отраженные в материалах конференций ДИАЛОГ-97 и КИИ-98 [50, 51], отличающиеся оригинальностью и новизной, и касающиеся ситуации в области автоматической обработки текста, интеллектуализации информационных технологий, аппарата знаний и новых поколений приложений. Будучи одним из пионеров исследований в области компьютерной лингвистики и активным разработчиком современных систем понимания ЕЯ-текстов [54, 122], Нариньяни А.С. критически оценивает состояние в области создания лингвистических моделей, подчеркивая смещение акцентов в сторону бесперспективного алгоритмического подхода и утверждает, что «следующее поколение технологии автоматической обработки текста должно ориентироваться на принципы, в корне отличные от тех, на которых до последнего времени базировалось подавляющее большинство проектов в этой области» [50, 56]. Оценивая результаты более трех десятилетий исследований и разработок в области автоматического понимания ЕЯ текста Нариньяни в работе [50] отмечает, что «результатов до обидного мало ... в рамках общепринятой до сегодня методологии никакая прикладная задача, включающая понимание ЕЯ текста, не может быть решена по крайней мере в ближайшие десять (а скорее всего, и тридцать) лет».

Одной из наиболее интересных работ последних лет, представляющей некий целостный механизм для инженерии языка (Language Engeneering -LE ), является проект GATE (a General Architecture for Text Engineering) - отражающий продвинутое представление об общей архитектуре систем обработки текстов [55, 119]. GATE является архитектурой, обеспечивающей общую инфраструктуру для разработки LE-систем, и содержит три основных модуля:

- база данных для хранения текстовой информации и оболочка базы данных, основанная на объектно-ориентированной модели (the GATE Document Manager - GDM);

- графический интерфейс для запуска средств обработки данных, просмотра и оценки результатов (the GATE Graphical Interface - GGI);

- совокупность объектов для ресурсов алгоритмов и данных, которые взаимодействуют с базой данных и интерфейсом и образуют совокупность повторно используемых объектов для задач LE (a Collection of Reusable Objects for Language Engineering - CREOLE).

Однако, оценивая положительно создание единого комплексного механизма обработки текстов, создающего удобство для разработчика и пользователя при проектировании систем и их эксплуатации, необходимо все же отметить, что такое агрерирование и технологизация, практически, не превносят ничего принципиально нового в идеологию и методологию LE. Более того, появляются трудности другого плана, связанные с несовместимостью представления текстовой информации с механизмами хранения, извлечения и межмодульного взаимодействия и несовместимостью типов информации в различных модулях.

Таким образом, в настоящее время имеется ряд подробных обзорных работ в области систем обработки ЕЯ-текстов, а также материалы семинаров и конференций, посвященных проблемам обработки ЕЯ-текстов [65, 89—93, 95], в которых исследуются современные подходы и методы их построения. Учитывая данное обстоятельство, в этой главе нами осуществлен аналитический обзор работ, в которых высказываются идеи, или предложены разработки, близкие к раскрываемому в диссертации прагматически-ориентированному подходу в построении лингвистических моделей и реализации систем обработки ЕЯ-текстов.

В зависимости от цели моделирования, может быть реализовано множество различных прагматически-ориентированных лингвистических моделей в рамках выделенных 4 классов. В нашей работе исследованы и построены лингвистические модели, соответствующие 2-4 классам моделей. В связи с этим мы сочли целесообразным провести целевой сравнительный анализ работ, касающихся диалоговых, концептуально-формальных и концептуально-функциональных моделей, отталкиваясь именно от разработанных и описываемых нами моделей. Подробный обзор систем, относящихся к первому классу, т.е. классу когнитивных моделей, и не рассматриваемых в нашей работе, приводится в работах [39, 68].


Анализ идей и подходов, близких к прагматически-ориентированному подходу построения лингвистических моделей.


В работе [50] Нариньяни А.С. раскрываются четыре следующих взаимосвязанных и взаимодополняющих принципа:

Семантически-ориентированный подход к анализу ЕЯ текста.

Эффективное использование знаний (как проблемных, так и общих) во время и после лингвистических этапов процесса анализа-понимания..

Организованное сообщество активных constraint-based агентов, а не система продукционных правил в качестве аппарата спецификации лингвистического обеспечения.

Снизу-вверх и распределенная, а не сверху-вниз централизованная организация процесса обработки, базирующегося на управлении по данным и\или событиям, а не на традиционном императивном типе управления.

Исследователь не только предлагает единый интегрированный подход к построению лингвистических моделей на основе объединения в единую технологию четырех перечисленных принципов, но и подробно рассматривает его со ссылками на конкретные проекты, осуществляемые РосНИИ ИИ. Такой подход во многом напоминает предложенный нами прагматически-ориентированный подход, однако, каждый из них имеет свою специфику, и скорее, эти подходы, совпадая в основе, в ряде моментов дополняют друг друга. Так, семантически-ориентированный подход к анализу ЕЯ текста определяется А.С.Нариньяни следующим образом: «пытайся восстановить смысл текста, используя всю доступную семантическую и прагматическую информацию; обращайся к синтаксическим компонентам только тогда, когда это необходимо для разрешения неоднозначности; это обращение должно соответствовать требованию минимальной достаточности - используй минимум информации, нужной для решения данной локальной задачи». Технология прагматически-ориентированного подхода также включает в качестве составляющих, практически, те же этапы, однако, согласно определения (см. Введение), она используется начиная с этапа методологии построения лингвистической модели, т.е. до того, как начинают фигурировать в качестве звена технологии сам текст и семантическая информация по нему. Второй принцип, т.е. эффективное использование знаний, соответственно, также расширяется долингвистическим этапом, а третий и четвертый принципы, вполне приемлемые в моделях «понимания» типа когнитивных и диалоговых (типа запросно-ответных или гибких), выглядят слишком категоричными для концептуально-формальных, концептуально-функциональных и диалоговых вопросно-ответных (жестких) моделей, выделяемых по прагматически-ориентированной технологии.

В работах [51, 53] Нариньяни высказывает следующую весьма продуктивную мысль о «модельном подходе»: «Получая на вход формальную Модель, машина автоматически сжимает n-мерное пространство значений ее параметров до минимального параллелепипеда, охватывающего всю область решений. При введении дополнительных ограничений или изменений Модели параллелепипед сжимается или меняет свои размеры в соответствии с новыми областями значений параметров, исчезая совсем, если Модель и\или введенные ограничения оказываются несовместимыми». Нам представляется, что с точки зрения прагматически-ориентированного подхода, саму входную модель можно было бы рассматривать как иерархию разнотипных моделей, взаимосвязанных и взаимозависимых, пересекающихся, возможно, лишь в цепочке прагматически-ориентированной технологии анализа ЕЯ-текста (модель ПО, модель диалога, модели языковых уровней, включающие соответствующие грамматики, модель среды и т.п.).

В целом, идеи А.С.Нариньяни о модельном, а не алгоритмическом подходе, о децентрализованном и асинхронном анализе текстов, об организованном сообществе активных constraint-based агентов - а это в нашем определении концептуально-функциональные лингвистические модели, и ряд других, весьма четко и убедительно очерчивают перспективные направления развития систем обработки информации, в том числе ЕЯ-текстов.

Семантически-ориентированный подход к процессу понимания текста на примере экспериментальной системы понимания описаний рентгеновских снимков рассматривается также и в работе И.С.Кононенко [40]. Практически, идеи, изложенные в работе [40], также в [52], сильно коррелируют с идеями построения прагматически-ориентированной диалоговой вопросно-ответной модели, изложенной Бухараевым-Сулеймановым в [25] с той разницей, что если в работе Каноненко И.С. объектом анализа является произвольный описательной текст в сильно-ограниченной предметной области (материал текстов рентгенологических описаний состояния органов грудной клетки), а в [32, 52] - изолированное сообщение в рамках ограниченной ПО, то в [25] объект анализа - это текст, являющийся одним из ожидаемых значений по заданному вопросу.

В работе «Методология минимизации усилий в инженерной лингвистике» [102] Шереметьева С.О. раскрывает идеи, также весьма близкие к прагматически-ориентированной технологии построения лингвистических моделей. Здесь приводится анализ основных методов экономии усилий, используемых при создании различных реально действующих систем автоматизированной обработки текста, и формулируется методология минимизаций усилий, которая определяет совокупность методов и правил выбора деятельности для создания компьютерных систем обработки текста в условиях ограниченных ресурсов времени и материалов языковых описаний, а также стандартных вычислительных алгоритмов.

В целом ряде проанализированных нами работ, авторы также явно или неявно высказывают, или даже используют при разработке конкретных систем, идеи, близкие по содержанию к идее прагматически-ориентированного подхода. Так, в работе Андрусенко Т.Б. [3] приводится следующее определение: "...прагматически ориентированным можно считать направление прикладных исследований и разработок, целью которых является определение теоретических и практических основ создания систем диалога с ЭВМ с учетом особенностей решаемых задач и стратегии использования ЕЯ".

Прагматически-ориентированный подход, по мнению Андрусенко, позволяет создать предпосылки и для разработки диалоговых моделей общего типа, которые бы отражали общие свойства задач данного класса с точки зрения функций общения при решении задач. Под прагматикой диалога здесь понимается организация диалога с точки зрения типа решаемой задачи (например, информационно-справочная, обучения, принятия решений), предметной области, варианта ЕЯ-диалога и речевой (коммуникативной) ситуации, выступающей фрагментом функционального окружения диалога. Прагматическая ориентация здесь заключается в способе выбора той или иной композиционной схемы диалога как варианта структуры диалога пользователя с системой, в отличие от нашего подхода, при котором, во-первых, изначально не делается акцент на определенную модель (диалоговую или недиалоговую), а соответствующая модель выбирается именно на основе прагматически-ориентированной технологии, во-вторых, наряду с общим и тематическим схемами диалога [35], важным является также и способ выбора средств для обработки естественно-языкового текста. Следующие утверждения, декларируемые в работе [3], практически, являются методологическим этапом прагматически-ориентированной технологии построения лингвистических моделей:

а) Ориентация на тип задачи определяет некую стратегию построения диалога.

б) Прагматика предметной области определяет допустимые границы интерпретации текста.

в) Прагматика языка общения связана с его употреблением в соответствии с целями в определенных ситуациях, в результате чего осуществляется выбор языковых средств этой интерпретации.

Вместе с тем, как справедливо замечает Андрусенко, прагматика даже в таком, более узком, ее понимании по-прежнему представляет собой наименее разработанный аспект диалога [3], а для более общих случаев построения прагматически-ориентированных моделей и технологий вопрос в такой постановке, практически, в литературе не рассматривается. Исследователи Дж.Гвида и К.Тассо [28, 118] предлагают подход к созданию систем понимания естественных языков, называемый целенаправленным анализом, подтверждая тем самым объективность и перспективность предлагаемой нами технологии построения прагматически-ориентированных лингвистических моделей. Модель понимания языка, предложенная Дж.Гвидо и др. [27], используется для решения задачи взаимодействия человека с ЭВМ и базируется на предположении о том, что ограниченность предметной области при взаимодействии с ЭВМ часто дает возможность создать эффективный интерфейс с системой искусственного интеллекта (СИИ). В случае прагматически-ориентированного подхода ограничение на ПО не констатируется, т.е. не делается явных ограничений на ПО, а ограничивается (определяется) режим диалога, фиксирующий активную и пассивную стороны. Под ЕЯ-интерфейсом в [27, 28] декларируется запрос к системе. В нашем же случае, естественно-языковой текст - это ответ на вопрос системы, причем, естественность заключается в том, что не накладывается никаких специальных ограничений на форму и полноту языка ответа. Ранее пути решения общей проблемы понимания ЕЯ, как отмечено вначале статьи, базировались, в основном, на чисто лингвистическом анализе входного текста. Однако, очевидно, что оптимальную модель понимания ЕЯ можно построить, если только эксплицитно учитывать ее цели и сферу применения [9, 14, 15, 16, 26, 33, 34, 35]. Если во главу угла будет поставлена цель взаимодействия с ЭВМ на ЕЯ, то это даст возможность отвлечься от многих лишних деталей и тонкостей входного текста и выбирать из них только релевантную информацию. Такой подход позволит увеличить эффективность алгоритмов анализа текста и в то же время обеспечит свободное взаимодействие с ЭВМ на ЕЯ. Авторы [27, 28] замечают, что такой принцип целенаправленного (goaloriented) анализа может с успехом использоваться в общей лингвистической теории, в которой семантика ЕЯ в контексте взаимодействия человека с ЭВМ определяется на основе таких понятий, как поведение, цели и планы слушающего и говорящего. Известно, что предложение может иметь несколько разных значений, в зависимости от целей говорящего и от точки зрения слушающего. При таком подходе сложность задачи понимания ЕЯ определяется не только особенностями устройства входного текста, но и внутренними свойствами участников диалога и широтой предметной области, в рамках которой осуществляется взаимодействие. Идея целенаправленного анализа положена в основу типовой системы, названной NLI (Natural Language Interface) и обслуживающей запросы к реляционным базам данных [27, 28, 118]. Предлагаемая модель понимания языка используется для решения задачи взаимодействия человека с ЭВМ и базируется на предположении о том, что ограниченность предметной области при взаимодействии с ЭВМ часто дает возможность создать эффективный интерфейс с СИИ. В основе проекта - принцип целенаправленного понимания ЕЯ на основе алгоритмов семантически- ориентированного анализа текста. Область приложения системы NLI-1 - обработка запросов на итальянском языке к небольшой реляционной базе данных, представляющий собой библиотечный каталог, в котором «понимание» достигается на уровне очень простых предложений на ЕЯ. В 1979 авторы разработали развитую систему NLI-2, которая осуществляло целенаправленное понимание ЕЯ и семантически-ориентированный анализ текста, было достигнуто улучшение понимания ЕЯ (вплоть до понимания текстов запросов, содержащих анафорические связи).

По мере накопления опыта разработки и эксплуатации диалоговых систем прагматическая концепция постепенно складывается как требование исследования и реализации моделей общения различного назначения. Одним из аспектов такого исследования может служить попытка сформулировать задачу следующим образом: определение влияния так называемых неязыковых факторов общения на выбор языковых средств передачи сообщений. Этими средствами выступают как целые языковые структуры (уровень композиционной схемы диалога), так и конкретные языковые элементы.

На необходимость комплексного, технологичного подхода к исследованию проблемы «понимания» текста, большей интеграции между семантикой уровня предложения или высказывания и теориями структур текста или диалога указывается и в работе [141]. С.Пулман справедливо утверждает, что последние работы в семантике сместили акцент с подхода, основанного чисто на предложении, однако степень того, насколько интерпретация отдельных предложений может зависеть от диалога или установок текста, или целей участника, гораздо больше, чем представляется в настоящее время. Как подчеркивается в работе [36] опыт разработки систем по
еще рефераты
Еще работы по разное