Реферат: Логическая грамматика

Логическиеграмматики превратились с течением лет в инструментарий высокого уровня, итеперь они позволяют пользователю сконцентрироваться на лингвистических феноменах.Грамматики, построенные на определенных предложениях, поддерживают использованиелогики для обработки данных естественного языка, и они подготовили почву дляпрактической работы лингвистов на языке программирования PROLOG.

ГРАММАТИКА, ПОСТРОЕННАЯ НА ОПРЕДЕЛЕННЫХПРЕДЛОЖЕНИЯХ (DEFINITE-CLAUSE GRAMMAR или DCG)

Проведениеработ по исследованию построения грамматик для понимания естественного языка(далее ЕЯ) приобрело большую популярность после введения Колмеройером в 1975году грамматических формализмов, основанных на предложениях Хорна. Такназываемые метаморфозные грамматики (metamorphosis grammars или MGs) определилирост заинтересованности в области выражения лингвистических понятий в логике(qv) и заложили основу для создания качественных блоков предварительнойобработки данных (процессоров ввода-вывода) и интерфейсов. Основное применениерезультаты этих исследовательских работ нашли в консультировании и создании базданных на основе ЕЯ, выработке вопросов и ответов, переводе текстов и синтезетекстов, исходя из надлежащим образом оформленных спецификаций.

Понятиеграмматик, построенных на определенных предложениях (DCGs), как особого случаяметаморфозных грамматик, было введено в 1978 году Перейрой и Уорреном в качествеграмматического формализма, для которого PROLOG имеет эффективный механизмсинтаксического анализа. Одни практические системы были созданы дляодновременного использования синтаксического и семантического знания дляпривнесения логики в структуру, содержа в себе информацию для семантическойинтерпретации. Другие системы были выстроены на более чем одном уровнетрансляции; использование синтаксического и семантического знанияосуществлялось отдельно друг от друга, и конечным результатом являлось вPROLOGе предложение Хорна, выполнение которого осуществлялось механизмом планирования(qv).

Техникаэкстрапозиционных грамматик (extraposition grammars или XGs) была предложенаПерейрой для описания определенных глобальных отношений или экстрапозиций, такихкак связь между относительным местоимением и его записью. В конечном итоге разработкинаподобие грамматик структуры определений (modifier structure grammars илиMSGs) Даля и МакКорда, древовидных грамматик (tree grammars или TGs)Колмеройера и усложненных грамматик (puzzle grammars или PGs) Сабатье увеличилисилу выражения лингвистических понятий.

Всеэти исследовательские работы по грамматическим формализмам, замешанным налогике, стали возможны и проще в осуществлении после выбора PROLOGа, языкапрограммирования основанного на подмножестве логики первого порядка.

ЛОГИЧЕСКИЕ ГРАММАТИКИ

Грамматикиописывают структуру (синтаксис) языков множеством продукций (правил,перерабатывающих текст). Например, правилом

sentence -> noun-phrase verb-phrase

устанавливаетсясвязь между тремя нетерминальными символами: предложение может состоять изименной группы и следующей за ней глагольной группы.

Такиеправила могут быть отображены в PROLOGе следующим образом:

sentence (S1, S3): — noun-phrase (S1, S2), verb-phrase (S2, S3).

verb-phrase (S1, S2): — connects (S1, writes, S2).

connects (1, each, 2).

connects (2, author, 3).

connects(3, writes, 4).

(Примечание:предикаты (т. е. выражения с неопределенными терминами, или переменными,которые преобразуются в истинные или ложные высказывания при выборе конкретныхзначений для этих самых терминов) заносятся в PROLOG через запятую. Переменныеотличаются от констант первой заглавной буквой.)

Внижеследующей записи числа обозначают начало и конец каждого слова:

1each2 author3 writes4

Чтобыпроверить правильность построения предложения, необходимо указать цель

? — sentence (1, 4).

(где? — бинарное обозначение структуры (или бинарный функтор), содержащееся в любойсистеме PROLOG) и продемонстрировать, что она подтверждается предыдущими условиями.Используя список в качестве информационной структуры для представления предложения,числа больше не нужны, так как PROLOG имеет устройство синтаксического анализа,способного перевести:

? — sentence ([each, author, writes]. [ ]).

Грамматики,построенные на определенных предложениях, являются объемом понятияконтекстно-свободных грамматик, которые также могут быть транслированы на языкPROLOG. Грамматики, построенные на определенных предложениях, позволяют любомулогическому выражению стать нетерминальным, они построены на логическихсимволах: константах, переменных, выражениях, — а не только на однихконстантах. Также они имеют только один нетерминальный символ в левой частикаждого правила. Контекстные зависимости (контекстные отношения подчинения)описываются логическими переменными в рамках параметров (или независимыхпеременных) грамматических символов.

Управила грамматики, построенной на определенных предложениях, следующая форма:

nonterminalsymbol -> body (основная часть программы).

где“body” (“основная часть”) является последовательностью одного или более элементовданных, отделенных друг от друга запятыми. Каждый элемент данных является либонетерминальным символом, либо последовательностью терминальных символов.Значение правила состоит в том, что «основная часть»- это возможнаяформа для группы типа “нетерминальный символ”. В PROLOGе нетерминальный символзаписывается как выражение (а не как список), а последовательность терминальныхсимволов — в виде списка.

Вправой части правила наряду с нетерминальными символами и списком терминальныхсимволов могут находиться последовательности вызовов процедур, записываемых в фигурныхскобках ({and}). Они используются для выражения дополнительных условий, которыев обязательном порядке должны выполнятся, чтобы правило действовало. Нетерминальныйсимвол преобразуется в (N + 2)-местный предикат (имеющий идентичное название),чьи первые N параметры полностью описаны в нетерминальном символе и чьипоследние два параметра являются такими же, как и при трансляцииконтекстно-свободного нетерминального символа. Вызовы процедур в правой частиправила транслируются так, как они есть.

Каждоеграмматическое правило, типа

p(X) -> q(X).

получаетгруппу входящих данных, анализирует некую исходную часть и генерирует остатокдля дальнейшего анализа. Это частное правило транслируется системой PROLOG как

p(X, S0, S): — q(X, S0, S).

Следовательно,система грамматической индексации в PROLOGе обеспечивает более сжатую запись,когда параметры для групп входящих и выходящих данных неявно выражены.

Когдав правиле содержатся терминальные символы, они транслируются со сказуемым«connects». К примеру,

connects(S1, X, S2)

означает,что суть S1 связана через X с сутью S2.

Правило

p(X) -> (older), q(X), (high).

преобразуетсяв

p(X, S0, S): - connects(S0, older, S1), q(X, S1, S2), connects(S2, high, S).

АНАЛИЗ ЕЯ

В1977 году Колмеройер ввел общую схему анализа ЕЯ, что явилось решающим шагомвперед и вызвало огромный интерес в области использования логических грамматиккак альтернативы прочно утвердившимся грамматикам расширенных сетей переходов(augmented transition network grammars). С исторической точки зрения, это можнопризнать поворотным пунктом, так как был указан метод преобразованияпредложений ЕЯ в логические структуры. Метод заключался в рассмотрениипростейших высказываний, содержащих собственные имена существительные, какой быто ни было артикль в виде квантора (кванторного слова) с тремя операциямиперехода и четыре приоритетных правила, для разрешения проблемы иерархииквантования (количественного измерения качественных признаков).

Краткийобзор общей схемы побуждает к дальнейшему развитию приемов составлениялогических грамматик. Например, предложение

Chomskyis (a) writer

содержитимя собственное, и глагол “to be” преобразуется в формулу

writer(chomsky)

Главнымобразом глаголы, прилагательные, имена существительные вводят характеристики сn параметрами. Для глаголов, n может равняться 1 [непереходные глаголы] или N+1[переходные глаголы, где N — количество комплементов (дополнений, следующих заглаголом в составном сказуемом и описывающих его подлежащее)]. Дляприлагательных и имен существительных n равняется или больше 1 (отношения, гдеn — это n-место его параметров). Параметры представляют в предложениидополнения при имени существительном, глаголе или прилагательном.

Например,предложение

Chomskywrites a book

содержитглагол “write”, существительное “book” и артикль “a” и может быть замененоследующей формой:

for a

B

such that

B is (a) book (1)

it is true that

Chomsky writes B (2)

где(1) и (2) являются простейшими высказываниями.

Этаже логическая структура может быть записана в стенографических индексах:

a(B, book (B), writes(Chomsky), B)).

Обратитевнимание, что высказывания (1) и (2) преобразуются в формулы “book(B)” и “writes(Chomsky,B),” соответственно.

Логическаяструктура выражает смысл предложения, и каждая из ее составных частейсоответствует смыслу обособленных слов согласно принципу Фреже. Записи,передающие значение, указываются как логические структуры, так как единственнымиз области значения, что люди научились точным образом представлять в видезаписи в ЭВМ, являются логические отношения.

Всякийартикль a представляет квантор q (кванторное слово) с тремя операциямиперехода, создающий новую формулу из переменной x и двух формул f1 и f2,

q(x, f1, f2).

Этаформула соответствует высказыванию

for a x such that e1, it is true that e2

гдеe1 и e2 являются простейшими высказываниями соответствующими f1 и f2.

Например, предложение

Chomsky writes a book for each publisher

содержитглагол “write”, два существительных (“book” и “publisher”) и два артикля (“a” и“each”) и может быть заменено следующей формой:

for each P such that P is a publisher it is true that for a B suchthat B is a book, it is true that Chomsky writes B for P

Предложениепреобразуется в логическую структуру

each(P,

publisher(P),

a(B,

book(B),

writes-for(Chomsky, B, P))).

Эталогическая структура отражает следующее приоритетное правило: в конструкции сиспользованием имени существительного (book) и его дополнения (publisher),квантование, представленное артиклем при дополнении, влияет на квантование,представленное артиклем при имени существительном. Помимо этого правилаКолмеройер предложил еще 3 приоритетных правила для организации возможностиквантования.

АНАЛИЗ КОЛМЕРОЙЕРА ДЛЯ КОНКРЕТНОГО ЕЯ

Общаясхема анализа была изначально предложена Колмеройером для французского ианглийского языков. Позднее Даль адаптировал ее для испанского, Коэлхо — дляпортугальского, а Пик предложил иную семантику для артиклей французского языка.

ОБЩАЯ СХЕМА АНАЛИЗА КОЛМЕРОЙЕРА В КАЧЕСТВЕГРАММАТИКИ, ПОСТРОЕННОЙ НА ОПРЕДЕЛЕННЫХ ПРЕДЛОЖЕНИЯХ (DCG)

DCGsподдерживают процессы синтаксического анализа и транслирования благодаря взятымими на вооружение из подмножества ЕЯ, необходимым элементам синтаксиса исемантики. Процесс синтаксического анализа состоит из доказательства, чтоцепочка слов является законным и правильно построенным предложением (с точкизрения выбранного синтаксиса). Процедура доказательства осуществляется через исследовательскуюстратегию (с конца на начало, сверху вниз, слева направо) и через правилоумозаключения (логического вывода), где заключением является qv, уже послеотработки системы PROLOG. Трансляция заключается в изображении каждогопредложения в виде логической структуры. Эта структура состоит из правильнопостроенных формул определенной логической системы, которая основывается наобъеме понятия логики предикатов(qv).

Механизмтранслирования выражается как множество определенных предложений логики черезграмматические правила PROLOGа. Он (механизм) может содержать, как вместе, таки по отдельности синтаксические и семантические знания из подмножестварассматриваемого ЕЯ. Механизм синтаксического анализа зависит от системыPROLOG, и он может быть вскрыт включением отслеживающего устройства. Трансляцияи синтаксический анализ — независимые друг от друга процессы, их независимостьпозволяет легче производить изменения в грамматике.

Упрощеннаяграмматика, обозначаемая через G, рассматривается следующим образом. Онапроизводит синтаксический анализ английских предложений, одновременно порождаясоответствующие им логические структуры. Грамматика определяется 2 модулями:

синтаксис+ семантика

морфология

иимеет дело с предложениями типа: Hodges writes for Penguin.

СИНТАКСИС + СЕМАНТИКА

sentences(S) -> noun-phrase(NP, S2, O),

verb([subject-X | L], O1),

complements(L, O1, O2).

complements([ ], O, O) -> [ ].

complements([K-N | L], O1, O3) -> complements(L, O1, O2),

case (K),

noun-phrase(N, O2, O3).

noun-phrase(N, O2, O4) -> article(N, O1, O2, O3),

common-noun([subject-N | L], O1),

complements(L, O3, O4).

noun-phrase(PN, O, O) -> [PN], {proper-noun(PN)}.

article[A, O1, O2 and (O1, O2)] -> [a].

case(for) -> [for].

case(direct) -> [ ].

МОРФОЛОГИЯ

verb([subject-A, for -P], is-published-by(A,P)) -> [writes].

common-noun([subject-P], publisher(P)) -> [publisher].

proper-noun(hodges).

proper-noun(penguin).

Кпримеру, правило:

noun-phrase(PN, O, O) -> [PN], {proper-noun(PN)}.

представляетсобой структуру:

noun-phrase(PN, O, O, S0, S): — connects(S0, PN, S),

proper-noun(PN).

Первоеправило грамматики G, по идее, признается справедливым только для предложений,в которых за именной группой следует глагол с возможно некоторыми дополнениями.Первое грамматическое правило для дополнений допускает их отсутствие(терминальный символ [ ] выступает в роли пустого списка), второе правило длядополнений определяет последовательность дополнений как группу данных,составленную из дополнения, падежа и именной группы.

Различныепараметры отличных друг от друга нетерминальных символов связаны одной и той желогической переменной. Это позволяет строить структуры в процессе унификации.

Именнаягруппа “a publisher” анализируется и транслируется грамматическим правилом как:

noun-phrase(N, Oa, Ob) -> article(N, Oc, Od, Oe),

common-noun(N, of),

{constraints(Oa, Ob, Oc, Od, Oe, Of)}.

Заметьте,что это правило — упрощенная версия четвертого правила представленнойграмматики G. Нетерминальный символ для именной группы имеет 3 параметра.Интерпретация последнего параметра Ob будет зависеть от характеристики Oaиндивидуума N, так как в общем именная группа содержит артикль, такой как “a”.

Теперьсмотри на правую часть правила. Слово “a” имеет интерпретацию Oe,

and(Oc, Od)

вконтексте двух характеристик Oc и Od индивидуума N. Характеристика Oc будетсоответствовать оставшейся части именной группы, содержащей слово “a”, ахарактеристика Od вытекает из остатка предложения. Значит, Oe будет содержатьвсеобъемлющую интерпретацию и связываться с Ob через одну и ту же переменную.Так как Of является характеристикой нарицательного существительного, онасвязывается с Oc одной и той же переменной. Oa имеет описание характеристик N,а также зависит от характеристик оставшейся части предложения. Поэтому Oaсвязывается с Od через одну и ту же переменную.

Каждоеслово ассоциируется с характеристикой. Например, значение глагола “writes”вводится отношением “is-published-by(A,P)”. Глагольное правило также содержитинформацию о характеристиках отношения, а именно то, что “A” играет рольподлежащего предложения а “P” “навязывает” использование предлога “for”.Значение неопределенного артикля “a” вводится конъюнкцией “and(O1, O2)”согласно определению, принятому в классической логике.

Болеепродвинутая по сравнению с G грамматика имела бы более скрупулезноразработанные дефиниции существительных, глаголов, прилагательных, артиклей:

noun([A-[ ] & author & type-X], pr(author(X))) ->no(author, A).

no(Type,GN) -> [Noun], {no1(Noun, Type, GN)}.

no1(author, author,mas-sin).

verb([(G-N)-V&type-X, dir-A-W&title-Y], pr(author(X, Y)))-> ve(writes, N).

ve(Type, N) -> [Verb], {ve1(Verb, Type, N)}.

ve1(writes, writes, sin).

adjective([A-{ }&author&type-X, prep(by)-_-[]&pub&type-Y], pr(published(Y,X))) -> ad(pub, A).

ad(Type, GN) -> [Adj], {ad1(Adj, Type, GN)}.

ad1(published, pub, mas-sin).

article(G-sin)-D-X, O1, O2, for([X, D] and (O1, O2)),cardinality(X, greater, 0))) art-ind(G-sin).

art-ind(mas-sin) -> [a]; [some].

(Замечание:безымянные переменные записываются в PROLOG как “_”.)

Этидефиниции включают синтаксические и семантические проверки, такие какграмматический род, число, семантические типы. Значение артикля такжеотличается. Вместо квантора с двумя операциями перехода оно было введеноквантором с тремя операциями перехода. Первая операция перехода — квантованиепеременной X, вторая — для основной характеристики “and” переменной X, третья — для точного определения характеристики (мощности множества) и ограниченияобласти переменной X.

ОБЛАСТЬ ПОНЯТИЙ ГРАММАТИК, ПОСТРОЕННЫХ НАОПРЕДЕЛЕННЫХ ПРЕДЛОЖЕНИЯХ

Экстрапозиционныеграмматики (XGs) увеличивают мощь DCGs при перечислении контекстныхзависимостей. Правила XG могут иметь в своей левой части более одногонетерминального символа и символ пробела “ “, выражающий случайную цепочкулогических символов (терминальных и нетерминальных). Например, правилоэкстрапозиционной грамматики

Relative-marker… complement -> [that].

утверждает,что относительное местоимение ”that” может быть проанализировано какотносительный показатель, за которым следуют какие-нибудь неизвестные фразы изатем дополнение.

XGsупрощают выражение синтаксических представлений и следовательно позволяютупростить трактовку семантических и логических описаний. Параметры длянетерминальных символов используются (как и в DCGs) для проверок согласования,производства дерева синтаксического анализа и ограничения возможностиприсоединения постмодификаторов.

Грамматикиструктуры определений (MSGs) увеличивают вероятность точного описаниянесинтаксических репрезентаций. Они упрощают автоматическое моделирование такихрепрезентаций при одновременно происходящем анализе.

Древовидные(или древесные) грамматики (TGs) позволяют лучше ориентировать лингвистическиеконструкции.

Усложненныеграмматики (PGs) являются средством, разработанным специально для нуждлингвистов. Правила их стратегии описывают порядок и режим трансляции, иописываются эти правила независимо друг от друга.

Список литературы

Дляподготовки данной работы были использованы материалы с сайта www.ed.vseved.ru/

еще рефераты
Еще работы по языкознанию, филологии