Реферат: Логическая грамматика

Логические грамматикипревратились с течением лет в инструментарий высокого уровня, и теперь онипозволяют пользователю сконцентрироваться на лингвистических феноменах.Грамматики, построенные на определенных предложениях, поддерживаютиспользование логики для обработки данных естественного языка, и ониподготовили почву для практической работы лингвистов на языке программированияPROLOG.

ГРАММАТИКА, ПОСТРОЕННАЯ НАОПРЕДЕЛЕННЫХ ПРЕДЛОЖЕНИЯХ (DEFINITE-CLAUSE GRAMMAR или DCG)

Проведение работ поисследованию построения грамматик для понимания естественного языка (далее ЕЯ)приобрело большую популярность после введения Колмеройером в 1975 годуграмматических формализмов, основанных на предложениях Хорна. Так называемыеметаморфозные грамматики (metamorphosis grammars или MGs) определили ростзаинтересованности в области выражения лингвистических понятий в логике (qv) изаложили основу для создания качественных блоков предварительной обработкиданных (процессоров ввода-вывода) и интерфейсов. Основное применение результатыэтих исследовательских работ нашли в консультировании и создании баз данных наоснове ЕЯ, выработке вопросов и ответов, переводе текстов и синтезе текстов,исходя из надлежащим образом оформленных спецификаций.

Понятие грамматик,построенных на определенных предложениях (DCGs), как особого случая метаморфозныхграмматик, было введено в 1978 году Перейрой и Уорреном в качествеграмматического формализма, для которого PROLOG имеет эффективный механизмсинтаксического анализа. Одни практические системы были созданы дляодновременного использования синтаксического и семантического знания дляпривнесения логики в структуру, содержа в себе информацию для семантическойинтерпретации. Другие системы были выстроены на более чем одном уровнетрансляции; использование синтаксического и семантического знанияосуществлялось отдельно друг от друга, и конечным результатом являлось вPROLOGе предложение Хорна, выполнение которого осуществлялось механизмом планирования(qv).

Техника экстрапозиционныхграмматик (extraposition grammars или XGs) была предложена Перейрой дляописания определенных глобальных отношений или экстрапозиций, таких как связьмежду относительным местоимением и его записью. В конечном итоге разработки наподобиеграмматик структуры определений (modifier structure grammars или MSGs) Даля иМакКорда, древовидных грамматик (tree grammars или TGs) Колмеройера иусложненных грамматик (puzzle grammars или PGs) Сабатье увеличили силувыражения лингвистических понятий.

Все эти исследовательскиеработы по грамматическим формализмам, замешанным на логике, стали возможны ипроще в осуществлении после выбора PROLOGа, языка программирования основанногона подмножестве логики первого порядка.

ЛОГИЧЕСКИЕ ГРАММАТИКИ

Грамматики описываютструктуру (синтаксис) языков множеством продукций (правил, перерабатывающихтекст). Например, правилом

sentence -> noun-phraseverb-phrase

устанавливается связь междутремя нетерминальными символами: предложение может состоять из именной группы иследующей за ней глагольной группы.

Такие правила могут бытьотображены в PROLOGе следующим образом:

sentence (S1, S3): — noun-phrase (S1, S2), verb-phrase (S2, S3).

verb-phrase (S1, S2): — connects (S1, writes, S2).

connects (1, each, 2).

connects (2, author, 3).

connects (3, writes, 4).

(Примечание: предикаты (т. е. выражения снеопределенными терминами, или переменными, которые преобразуются в истинныеили ложные высказывания при выборе конкретных значений для этих самых терминов)заносятся в PROLOG через запятую. Переменные отличаются от констант первой заглавнойбуквой.)

В нижеследующей записи числаобозначают начало и конец каждого слова:

1each2 author3 writes4

Чтобы проверить правильностьпостроения предложения, необходимо указать цель

? — sentence (1, 4).

(где? — бинарноеобозначение структуры (или бинарный функтор), содержащееся в любой системеPROLOG) и продемонстрировать, что она подтверждается предыдущими условиями.Используя список в качестве информационной структуры для представленияпредложения, числа больше не нужны, так как PROLOG имеет устройствосинтаксического анализа, способного перевести:

? — sentence ([each, author,writes]. [  ]).

Грамматики, построенные наопределенных предложениях, являются объемом понятия контекстно-свободныхграмматик, которые также могут быть транслированы на язык PROLOG. Грамматики,построенные на определенных предложениях, позволяют любому логическомувыражению стать нетерминальным, они построены на логических символах:константах, переменных, выражениях, — а не только на одних константах. Такжеони имеют только один нетерминальный символ в левой части каждого правила.Контекстные зависимости (контекстные отношения подчинения) описываютсялогическими переменными в рамках параметров (или независимых переменных)грамматических символов.

У правила грамматики,построенной на определенных предложениях, следующая форма:

nonterminal symbol ->body (основная часть программы).

где “body” (“основнаячасть”) является последовательностью одного или более элементов данных, отделенныхдруг от друга запятыми. Каждый элемент данных является либо нетерминальнымсимволом, либо последовательностью терминальных символов. Значение правиласостоит в том, что «основная часть»- это возможная форма для группытипа “нетерминальный символ”. В PROLOGе нетерминальный символ записывается каквыражение (а не как список), а последовательность терминальных символов — ввиде списка.

В правой части правиланаряду с нетерминальными символами и списком терминальных символов могутнаходиться последовательности вызовов процедур, записываемых в фигурных скобках({and}). Они используются для выражения дополнительных условий, которые вобязательном порядке должны выполнятся, чтобы правило действовало.Нетерминальный символ преобразуется в (N+ 2)-местный предикат (имеющий идентичное название), чьи первые N параметры полностью описаны внетерминальном символе и чьи последние два параметра являются такими же, как ипри трансляции контекстно-свободного нетерминального символа. Вызовы процедур вправой части правила транслируются так, как они есть.

Каждое грамматическоеправило, типа

p(X) -> q(X).

получает группу входящихданных, анализирует некую исходную часть и генерирует остаток для дальнейшегоанализа. Это частное правило транслируется системой PROLOG как

p(X, S0, S): — q(X, S0, S).

Следовательно, система грамматической индексации вPROLOGе обеспечивает более сжатую запись, когда параметры для групп входящих ивыходящих данных неявно выражены.

Когда в правиле содержатсятерминальные символы, они транслируются со сказуемым «connects». Кпримеру,

connects(S1, X, S2)

означает, что суть S1связана через X с сутью S2.

Правило

p(X) -> (older), q(X),(high).

преобразуется в

p(X, S0, S): —

connects(S0, older, S1),

q(X, S1, S2),

connects(S2, high, S).

АНАЛИЗ ЕЯ

В 1977 году Колмеройер ввелобщую схему анализа ЕЯ, что явилось решающим шагом вперед и вызвало огромныйинтерес в области использования логических грамматик как альтернативы прочноутвердившимся грамматикам расширенных сетей переходов (augmented transitionnetwork grammars). С исторической точки зрения, это можно признать поворотнымпунктом, так как был указан метод преобразования предложений ЕЯ в логическиеструктуры. Метод заключался в рассмотрении простейших высказываний, содержащихсобственные имена существительные, какой бы то ни было артикль в виде квантора(кванторного слова) с тремя операциями перехода и четыре приоритетных правила,для разрешения проблемы иерархии квантования (количественного измерениякачественных признаков).

Краткий обзор общей схемыпобуждает к дальнейшему развитию приемов составления логических грамматик.Например, предложение

Chomsky is (a) writer

содержит имя собственное, иглагол “to be” преобразуется в формулу

writer(chomsky)

Главным образом глаголы,прилагательные, имена существительные вводят характеристики с n параметрами. Для глаголов, n можетравняться 1 [непереходные глаголы] или N+1[переходные глаголы, где N — количество комплементов (дополнений, следующих за глаголом в составномсказуемом и описывающих его подлежащее)]. Для прилагательных и именсуществительных n равняется илибольше 1 (отношения, где n — это n-место его параметров). Параметрыпредставляют в предложении дополнения при имени существительном, глаголе илиприлагательном.

Например, предложение

Chomsky writes a book

содержит глагол “write”, существительное“book” и артикль “a” и может быть заменено следующей формой:

                                                                        fora

                                                                                    B

                                                                        suchthat

                                                                                    Bis (a) book                (1)

                                                                        itis true that

                                                                                    Chomskywrites B       (2)

где (1) и (2) являютсяпростейшими высказываниями.

Эта же логическая структураможет быть записана в стенографических индексах:

a(B, book (B),writes(Chomsky), B)).

Обратите внимание, чтовысказывания (1) и (2) преобразуются в формулы “book(B)” и “writes(Chomsky,B),” соответственно.

Логическая структуравыражает смысл предложения, и каждая из ее составных частей соответствуетсмыслу обособленных слов согласно принципу Фреже. Записи, передающие значение,указываются как логические структуры, так как единственным из области значения,что люди научились точным образом представлять в виде записи в ЭВМ, являютсялогические отношения.

Всякий артикль a представляет квантор q (кванторное слово) с тремя операциямиперехода, создающий новую формулу из переменной x и двух формул f1 и f2,

q(x, f1, f2).

Эта формула соответствуетвысказыванию

for a x such that e1, it is true that e2

где e1 и e2 являютсяпростейшими высказываниями соответствующими f1 и f2.

Например, предложение

Chomsky writes a book foreach publisher

содержит глагол “write”, двасуществительных (“book” и “publisher”) и два артикля (“a” и “each”) и можетбыть заменено следующей формой:

for each P such that P is apublisher it is true that for a B such that B is a book, it is true thatChomsky writes B for P

Предложение преобразуется влогическую структуру

                                                            each(P,

                                                                        publisher(P),

                                                                        a(B,

                                                                                    book(B),

                                                                                    writes-for(Chomsky,B, P))).

Эта логическая структураотражает следующее приоритетное правило: в конструкции с использованием именисуществительного (book) и его дополнения (publisher), квантование,представленное артиклем при дополнении, влияет на квантование, представленноеартиклем при имени существительном. Помимо этого правила Колмеройер предложилеще 3 приоритетных правила для организации возможности квантования.

АНАЛИЗ КОЛМЕРОЙЕРА ДЛЯКОНКРЕТНОГО ЕЯ

Общая схема анализа былаизначально предложена Колмеройером для французского и английского языков.Позднее Даль адаптировал ее для испанского, Коэлхо — для португальского, а Пикпредложил иную семантику для артиклей французского языка.

ОБЩАЯ СХЕМА АНАЛИЗАКОЛМЕРОЙЕРА В КАЧЕСТВЕ ГРАММАТИКИ, ПОСТРОЕННОЙ НА ОПРЕДЕЛЕННЫХ ПРЕДЛОЖЕНИЯХ(DCG)

DCGs поддерживают процессысинтаксического анализа и транслирования благодаря взятым ими на вооружение изподмножества ЕЯ, необходимым элементам синтаксиса и семантики. Процесссинтаксического анализа состоит из доказательства, что цепочка слов являетсязаконным и правильно построенным предложением (с точки зрения выбранногосинтаксиса). Процедура доказательства осуществляется через исследовательскуюстратегию (с конца на начало, сверху вниз, слева направо) и через правилоумозаключения (логического вывода), где заключением является qv, уже послеотработки системы PROLOG. Трансляция заключается в изображении каждогопредложения в виде логической структуры. Эта структура состоит из правильнопостроенных формул определенной логической системы, которая основывается наобъеме понятия логики предикатов(qv).

Механизм транслированиявыражается как множество определенных предложений логики через грамматическиеправила PROLOGа. Он (механизм) может содержать, как вместе, так и поотдельности синтаксические и семантические знания из подмножестварассматриваемого ЕЯ. Механизм синтаксического анализа зависит от системыPROLOG, и он может быть вскрыт включением отслеживающего устройства. Трансляцияи синтаксический анализ — независимые друг от друга процессы, их независимостьпозволяет легче производить изменения в грамматике.

Упрощенная грамматика,обозначаемая через G, рассматривается следующим образом. Она производитсинтаксический анализ английских предложений, одновременно порождаясоответствующие им логические структуры. Грамматика определяется 2 модулями:

1)   синтаксис + семантика

2)   морфология

и имеет дело с предложениямитипа: Hodges writes for Penguin.

СИНТАКСИС + СЕМАНТИКА

sentences(S) ->noun-phrase(NP, S2, O),

                                    verb([subject-X | L], O1),

                                    complements(L, O1, O2).

complements([  ], O, O) -> [  ].

complements([K-N | L], O1,O3) -> complements(L, O1, O2),

                                                                    case (K),

                                                                    noun-phrase(N, O2, O3).

noun-phrase(N, O2, O4) ->article(N, O1, O2, O3),

                                                        common-noun([subject-N | L], O1),

                                                        complements(L, O3, O4).

noun-phrase(PN, O, O) ->[PN], {proper-noun(PN)}.

article[A, O1, O2 and (O1,O2)] -> [a].

case(for) -> [for].

case(direct) -> [  ].

МОРФОЛОГИЯ

verb([subject-A, for -P],is-published-by(A,P)) -> [writes].

common-noun([subject-P],publisher(P)) -> [publisher].

proper-noun(hodges).

proper-noun(penguin).

К примеру, правило:

noun-phrase(PN, O, O) ->[PN], {proper-noun(PN)}.

представляет собойструктуру:

noun-phrase(PN, O, O, S0,S): — connects(S0, PN, S),

                                                            proper-noun(PN).

Первое правило грамматики G,по идее, признается справедливым только для предложений, в которых за именнойгруппой следует глагол с возможно некоторыми дополнениями. Первое грамматическоеправило для дополнений допускает их отсутствие (терминальный символ [  ] выступает в роли пустого списка), второеправило для дополнений определяет последовательность дополнений как группуданных, составленную из дополнения, падежа и именной группы.

Различные параметры отличныхдруг от друга нетерминальных символов связаны одной и той же логическойпеременной. Это позволяет строить структуры в процессе унификации.

Именная группа “a publisher”анализируется и транслируется грамматическим правилом как:

noun-phrase(N, Oa, Ob) ->article(N, Oc, Od, Oe),

                                                        common-noun(N, of),

                                                       {constraints(Oa, Ob, Oc, Od, Oe, Of)}.

Заметьте, что это правило — упрощенная версия четвертого правила представленной грамматики G.Нетерминальный символ для именной группы имеет 3 параметра. Интерпретацияпоследнего параметра Ob будет зависеть от характеристики Oa индивидуума N, таккак в общем именная группа содержит артикль, такой как “a”.

 Теперь смотри на правую часть правила. Слово“a” имеет интерпретацию Oe,

and(Oc, Od)

в контексте двуххарактеристик Oc и Od индивидуума N. Характеристика Oc будет соответствовать оставшейсячасти именной группы, содержащей слово “a”, а характеристика Od вытекает изостатка предложения. Значит, Oe будет содержать всеобъемлющую интерпретацию исвязываться с Ob через одну и ту же переменную. Так как Of являетсяхарактеристикой нарицательного существительного, она связывается с Oc одной итой же переменной. Oa имеет описание характеристик N, а также зависит отхарактеристик оставшейся части предложения. Поэтому Oa связывается с Od черезодну и ту же переменную.

Каждое слово ассоциируется схарактеристикой. Например, значение глагола “writes” вводится отношением“is-published-by(A,P)”. Глагольное правило также содержит информацию охарактеристиках отношения, а именно то, что “A” играет роль подлежащегопредложения а “P” “навязывает” использование предлога “for”. Значениенеопределенного артикля “a” вводится конъюнкцией “and(O1, O2)” согласноопределению, принятому в классической логике.

Более продвинутая посравнению с G грамматика имела бы более скрупулезно разработанные дефинициисуществительных, глаголов, прилагательных, артиклей:

noun([A-[  ]& author & type-X], pr(author(X))) -> no(author, A).

no(Type,GN) -> [Noun], {no1(Noun, Type, GN)}.

no1(author, author,mas-sin).

verb([(G-N)-V&type-X, dir-A-W&title-Y],pr(author(X, Y))) -> ve(writes, N).

ve(Type, N) -> [Verb], {ve1(Verb, Type, N)}.

ve1(writes, writes, sin).

adjective([A-{ }&author&type-X, prep(by)-_-[ ]&pub&type-Y], pr(published(Y,X))) -> ad(pub, A).

ad(Type, GN) -> [Adj], {ad1(Adj, Type, GN)}.

ad1(published, pub, mas-sin).

article(G-sin)-D-X, O1, O2, for([X, D] and (O1,O2)), cardinality(X, greater, 0))) art-ind(G-sin).

art-ind(mas-sin) -> [a]; [some].

(Замечание: безымянныепеременные записываются в PROLOG как “_”.)

Эти дефиниции включаютсинтаксические и семантические проверки, такие как грамматический род, число,семантические типы. Значение артикля также отличается. Вместо квантора с двумяоперациями перехода оно было введено квантором с тремя операциями перехода.Первая операция перехода — квантование переменной X, вторая — для основнойхарактеристики “and” переменной X, третья — для точного определения характеристики(мощности множества) и ограничения области переменной X.

ОБЛАСТЬ ПОНЯТИЙ ГРАММАТИК,ПОСТРОЕННЫХ НА ОПРЕДЕЛЕННЫХ ПРЕДЛОЖЕНИЯХ

Экстрапозиционные грамматики(XGs) увеличивают мощь DCGs при перечислении контекстных зависимостей. ПравилаXG могут иметь в своей левой части более одного нетерминального символа и символпробела “   “, выражающий случайнуюцепочку логических символов (терминальных и нетерминальных). Например, правилоэкстрапозиционной грамматики

Relative-marker...complement -> [that].

утверждает, чтоотносительное местоимение ”that” может быть проанализировано как относительныйпоказатель, за которым следуют какие-нибудь неизвестные фразы и затем дополнение.

XGs упрощают выражениесинтаксических представлений и следовательно позволяют упростить трактовкусемантических и логических описаний. Параметры для нетерминальных символовиспользуются (как и в DCGs) для проверок согласования, производства деревасинтаксического анализа и ограничения возможности присоединенияпостмодификаторов.

Грамматики структурыопределений (MSGs) увеличивают вероятность точного описания несинтаксическихрепрезентаций. Они упрощают автоматическое моделирование таких репрезентацийпри одновременно происходящем анализе.

Древовидные (или древесные)грамматики (TGs) позволяют лучше ориентировать лингвистические конструкции.

Усложненные грамматики (PGs)являются средством, разработанным специально для нужд лингвистов. Правила ихстратегии описывают порядок и режим трансляции, и описываются эти правиланезависимо друг от друга.

еще рефераты
Еще работы по литературе, лингвистике