Реферат: О структуре активной системы обучения русскому языку



О структуре активной системы обучения русскому языку


Г.К.Хахалин, Е.Н.Честная


Научно-Исследовательский Центр Электронной Вычислительной

Техники


Введение

Современные автоматизированные системы обучения естественному (английскому, русскому и др.) языку предоставляют обучаемому (ученику) средства, чтобы он в игровой манере осваивал “азы” языка. Но при этом от обучаемого в подобных системах требуется только активность типа “подстановок” (нажатие определенных клавиш, выбор определенных изображений, вставка определенных букв, слов, словосочетаний и т.п.), а система чаще всего отвечает “да” или “нет” (правильно/неправильно). Обучаемый не может задавать системе какие-либо вопросы по рассматриваемой теме, не может узнать толкование незнакомого ему слова или посмотреть в динамике как выполняет на каком-либо примере аналогичное задание сама система. Чтобы расширить возможности системы обучения и повысить активность процесса необходимо привлечение современных программных лингвистических средств. Это позволило бы: 1) предоставить обучаемому больше возможностей для освоения языка, т.е. расширить сферы того, чем может пользоваться ученик в процессе обучения; 2) не теряя игровых аспектов, сделать систему более активной, включив элементы решения языковых упражнений самой системой, т.е. создать такие условия, при которых ученик как бы “заставляет” работать саму программную систему (а также и себя), задавая ей в качестве упражнений свои слова, словосочетания, предложения и небольшие тексты. При этом система анализирует и/или преобразует текстовые данные, а результаты анализа и/или преобразования выдаются на экран обучаемому для последующего восприятия и осмысления.

Основная цель доклада — показать, какие можно использовать программные лингвистические средства дополнительно к уже существующим в системах обучения и как их соотнести с содержанием курса обучения по русскому языку.

На сегодняшний день наработано и разработано достаточно много изолированных друг от друга программных средств, которые в единой системе могли бы представлять собой мощную базу для обучения русскому языку. К этим средствам относятся: графика и анимация; речевой анализ и синтез; лингвистические (языковые) игры; всевозможные языковые словари; орфографические и синтаксические корректоры; системы правильного переноса; лингвистические трансляторы и т.д.

Графика и анимация не относятся к теме конференции, поэтому здесь не рассматриваются. Речевой анализ и синтез является обширной темой, поэтому вопросы фонетического плана оставляем за рамками доклада. Успехи и сложности работ по речевому анализу/синтезу можно оценить по [1] и по другим докладам конференции “Диалог-97”.

Основное рассмотрение будет касаться возможности использования лингвистических языковых средств (лингвистические игры, словари, корректоры, лингвистический транслятор) и их соотнесение с разделами курса обучения по русскому языку [2].

^ 1. Лингвистические игры

Как известно [3], существуют игры тренирующие, обучающие и развивающие. Тренирующие отрабатывают навыки, которыми игрок уже обладает. Обучающие дают возможность приобретения новых знаний и навыков. Развивающие — развивают фундаментальные способности и навыки, например, сообразительность, умение сосредоточиться, мыслить логически, искать закономерности, память.

В области multi media наиболее распространены бесконечные, усложняющиеся, недерминированные игры. Лингвистические игры — специфическая часть этой области и наиболее динамичная часть системы обучения. Они достаточно подробно описаны в [4] (например: “1 или 2 буквы”, “НЕ или НИ”, “цепочка”, “эхо”, “хвост”, “квадрат”, “россыпь” и др.) и частично представлены в системе “Полиглот” [5] (Мигалка, Леттрис, Поле чудес, Логикон, Анаграмма, Катакомба, Буквоед, Карусель, Хамелеон и др.).

Для многих лингвистических игр “сменная” база превращает их в квази бесконечные игры. Наличие в системе обучения множества словарей (см. ниже), их соответствующая разбивка и структуризация позволяет разнообразить языковые игры, сделать их усложняющимися, с переменной лексикой для каждого сеанса с учетом рассматриваемой темы и возраста обучаемого. Для игр можно использовать не только словари, но и другие лингвистические средства (например, средства генерирования слов для игр типа “Кроссворд”, “Эрудит” и т.п.).

^ 2. Языковые словари

Всевозможные словари могут служить в системе обучения разным целям. Одни — чтобы быть “под рукой”, что дает возможность обучаемому достаточно быстро получить необходимую информацию. Другие используются как базы для лингвистических игр. Третьи служат для внутренних целей и обучаемый не имеет непосредственного доступа к ним. Один и тот же словарь (или его разновидности) может использоваться для разных целей.

Словари для системы обучения можно было бы разделить функционально на следующие группы: морфемный и морфологический словари; фразеологический словарь; словари антонимов и синонимов; толковые и энциклопедические словари; словообразовательный словарь; словарь пунктуационных правил; словарь правил правописания; словарь управлений; словарь синтаксических правил и словарь структур сложных предложений и др.

На рынке программных продуктов существуют разные словари. Например, в программной систему “^ Русский филолог” [6] есть следующие: толковый словарь (на основе словаря Ожегова С.И.); словарь синонимов и антонимов; словообразовательный словарь (на основе словаря Тихонова А.И.); словарь управлений (на основе словаря Розенталя Д.Э.) и др.

Для разных групп учеников хорошо бы иметь разные толковые словари. Для их создания можно использовать ^ Программно-технологический комплекс разработки электронных толковых словарей [7], который позволяет создавать различные толковые словари с заполнением на любую выбранную тематическую область. Комплекс состоит из оболочки электронного словаря с быстрым доступом к словарным статьям по любой словоформе и системы настройки на конкретную область. Разнообразие режимов работы со словарем позволяет вводить любое слово или, просматривая текстовый файл, выбирать любое слово в произвольной морфологической форме и получать его толкование, не задумываясь о стандартной форме слова; получать всю предысторию работы со словарем и возвращаться на любой из предыдущих этапов; работать со словарной толковой статьей как с обычным текстовым файлом и т.д.

Также в рамках системы обучения хорошо бы использовать ^ Морфологический словарь русского языка, который при анализе словоформы выдает ее характеристики в привычной для ученика форме. Результатами работы этого словаря являются: синтаксические характеристики словоформы (имя синтаксического класса, к которой принадлежит словоформа - существительное, глагол, прилагательное, причастие и т.д.); морфологические характеристики словоформы (лексема, основа, окончание, род, число, падеж и т.д.); все омонимии словоформы (например, кладу - существительное и глагол, простой - существительное и прилагательное, цари - существительное и глагол и т.п.). Отметим, что исходя из формы представления результата этот словарь доступен обучаемому при решении упражнений по разбору слова на основу и окончание, на принадлежность слова к синтаксическому классу и т.п. Он отличается от словаря, используемого для морфологического анализа, только надстройкой.

При освоении раздела курса “Орфография” (написание приставок, корневых морфем, суффиксов и окончаний; перенос слов) можно типичные упражнения решать при использовании морфемного словаря: 1) правильно расставить в тексте Ь и Ъ (ворон..е гнездо, об..ем шара); 2) подобрать родственные слова для проверки правильности написания проверяемых букв в словах (чудесный пейзаж - чудеса); 3) правильно расставить Ь после шипящих (мороз жгуч.., разжеч.. костер, почуствовать фальш..); 4) разбить слова в соответствии с правилами переноса (тя-же-лая и силь-ная ры-ба). Тот же словарь используется при освоении раздела курса “Состав слова и словообразование”, когда решаются упражнения на морфемный состав слова и на способы словообразования в русском языке. Упражнения в этом разделе предлагают: 1) указать в словах основу и окончание, в основе - корень, приставку и суффикс (по-груз-к-а, вы-ход-ом); 2) вставить пропущенные буквы после шипящих (руч..нка, реч..нька); 3) определить, какими способами образованы предлагаемые слова (подпрыгнуть, хлебозавод); 4) вставить пропущенные буквы в приставках ПРЕ- и ПРИ- (пр..землиться в степи, пр..открыть дверь) и др.

При изучении раздела “Лексика и фразеология” рассматриваются типы значений слов (отнесение слов к определенной части речи, однозначные и многозначные слова, прямые и переносные значения слов, синонимы и антонимы) и лексикография русского языка. Здесь можно использовать морфологический, энциклопедический и толковый словари; словари антонимов и синонимов и фразеологический словарь, поскольку характерными упражнениями являются: 1) выделить слова, употребленные в переносном значении (Глубокое молчание царствовало кругом.); 2) выделить устаревшие слова и подобрать к ним современные синонимы (Раз, в начале осени Кирилла Петрович собрался в отъезжее поле (дальнее поле для охоты).); 3) заменить выделенные слова фразеологическими оборотами (долго размышлять над задачей - ломать голову, работать небрежно - работать спустя рукава.) и т.п.

3. Корректоры

Для реального анализа вводимой обучаемым текстовой информации система должна исправлять орфографические и синтаксические ошибки, эффективно направляя тем самым процесс обучения. Для этого в системе должны присутствовать орфографический и синтаксический корректоры.

^ Орфографический корректор должен использоваться не только для исправления допущенных обучаемым орфографических ошибок, но и для вставки букв на место подчеркивания или многоточия (как в ко_ектив, бака_ея), когда система сама решает упражнения. В настоящее время существуют орфокорректоры для русского языка (например, ORFO, ПРОПИСЬ и др.), но с учетом специфики взять какой-либо из них для системы обучения без модификации не представляется возможным.

^ Синтаксический корректор предназначен для орфографической и синтаксической проверки словосочетаний и предложений. Он должен включать в себя в качестве составляющей орфокорректор. Дополнительно к функциям орфокорректора синтаксический корректор должен проверять согласование слов в синтаксических группах, расставлять отсутствующие знаки препинания и т.п., а также выдавать параметры, связанные с особенностями текста: легкость чтения фразы, ее сложность, благозвучие и глубина предложения. Синтаксический корректор должен работать со словосочетаниями, которые представлены в “сыром” виде, например, в упражнениях на согласование типа красного кирпич.., на управление — удивляться (талант юного музыканта) --> удивляться таланту юного музыканта и т.п.

^ 4. Лингвистический транслятор

Лингвистический транслятор в системе обучения предназначен для: разбора словосочетаний и предложений по частям речи и по членам предложения; разбивки осложненных и сложных предложений на составляющие фразы; получения перефразировок предложений; синтеза словосочетаний и предложений по заданным параметрам и др.

Он включает в себя лингвистический (морфологический и синтаксический) анализатор/синтезатор и подключает по мере необходимости орфографический и синтаксический корректоры для исправления ошибок обучаемого.

Все эти функции реализуются на словосочетаниях, предложениях и небольших текстах из упражнений для ученика и упражнений, задаваемых самим учеником. В первом случае система предоставляет обучаемому результат, который он мог бы сравнить со своим; во втором — система демонстрирует динамику получения результата, чтобы ученик видел этот процесс.

В качестве основы можно взять лингвистический транслятор [8, 9], состоящий из лингвистического процессора и лингвистической базы знаний. Лингвистический процессор обеспечивает активную работу обучаемого как с отдельными словами, так и с различными видами простых, осложненных и сложных предложений и небольших абзацев текста. Лингвистическая база знаний представляет собой модель языка, включая морфологию и синтаксис в объеме, необходимом для изучения русского языка.

^ Морфологический анализатор/синтезатор состоит из: морфологического словаря, программ морфологического анализа/синтеза, программы доступа к морфологическим статьям словаря и программы настройки на заданный морфологический словарь.

Программы морфологического анализа/синтеза предназначены для анализа заданной словоформы русского языка с выдачей морфологических признаков (МОРАН) и генерирования (синтеза) по заданной лексеме с приписанными ей необходимыми морфологическими признаками требуемой словоформы (МОРСИ).

При изучении раздела курса “Морфология” можно использовать морфологический словарь (при выполнении упражнений обучаемым) и лингвистический анализатор (при решении упражнения самой системой). Характерные упражнения предлагают: 1) провести разбор предложений по частям речи [Я (местоимение) несколько (местоимение) раз (существительное) выстрелил (глагол) в (предлог) воздух (существительное), но (союз) не (частица) получил (глагол) никаких (местоимение) ответных (прилагательное) сигналов (существительное)]; 2) указать разряды местоимений [Сначала я (личное местоимение) сам (возвратное местоимение) думал что (предметно-личное местоимение) такое (местоимение прилагательное) бывает только в сказке]; 3) указать наклонения глаголов, их спряжение [Не удержался (изъявительное накл.) за гриву, за хвост не удержишься (повелительное накл., II спряжение)]; 4) проспрягать указанные глаголы (дышать - дышу, дышишь, дышит, дышим, дышите, дышат). Для последнего упражнения привлекается морфологический синтезатор.

^ Синтаксический анализатор/синтезатор состоит из: системы синтаксического анализа/синтеза ЕЯ-предложений (включая морфологический анализатор/синтезатор), подсистемы разбивка осложненных и сложных предложений на составляющие фразы; подсистемы перефразировок предложений; расширенного компонента для анализа/синтеза абзацев ЕЯ-текста для восстановления эллиптических и анафорических фраз.

Для реализации процедур синтаксического разбора простых предложений используется словарь “контекстных” структур, в которых записаны правила сочетания фрагментов ЕЯ-предложений; при разборе осложненных и сложных предложений используется словарь контекстных структур для разбивки сложных предложений на простые фразы и правила восстановления эллипсисов в рамках предложений или абзацев.

Основная нагрузка на лингвистический транслятор падает при освоении раздела курса “Синтаксис”, в котором изучают словосочетание, связь слов в словосочетаниях; простое предложение, виды простых предложений, главные и второстепенные члены предложений; сложное предложение, виды сложных предложений; пунктуация в простых и сложных предложениях и т.д.

Типичные упражнения в этом разделе предлагают: 1) найти в приведенных словосочетаниях главные и зависимые слова, указать, какими частями речи они выражены [боевой (зависимое, прилагательное) друг (главное, существительное)]; 2) к данным словосочетаниям подобрать синонимичные [горный воздух - воздух гор, лесной запах - запах леса]; 3)назвать способ связи слов в приведенных словосочетаниях [любить тишину - управление, сидеть согнувшись - примыкание, красным кубом - согласование]; 4) разобрать предложения по членам предложения, расставить знаки препинания [Долго (обстоятельство) в темноте (обстоятельство) горел (сказуемое) фонарик (подлежащее) ] и т. д. Синтезатор может служить для синтеза словосочетаний с определенными свойствами, а также для получения перефразировок ЕЯ-предложений.

Заключение

Введение в структуру системы обучения русскому языку предлагаемых компонентов позволило бы: повысить активность ученика за счет повышения активности системы; реализовать адекватные “подсказки” ученику в зависимости от сделанных ошибок; динамично иллюстрировать процесс выполнения упражнений самой системой; расширить спектр предоставляемых возможностей (например, словари “под рукой”); увеличить лингвистическую базу знаний для динамической подкачки материала для игр и упражнений (с учетом знаний конкретного ученика); реально анализировать результаты решения упражнений учеником (а не просто сравнивать — типа string - string — результат с ответом); оценивать решения не только по количеству ошибок, но и по их качеству (система может оценить, где ученик допустил “непроизвольную”, ошибку, например, орфографическую ошибку при набивке слова, когда в целом предложение правильно) и т.д.

Литература

1. Волкова И.А., Головин И.Г. Об одном подходе к построению синтаксического модуля в системе распознавания устной речи. Труды Международного семинара Диалог-97 по компьютерной лингвистике и ее приложениям, Москва, 1997, с. 61-63

2. Розенталь Д.Э., Голуб И.Б., Теленкова М.А. Современный русский язык. М.: “Международные отношения”, 1995, 560 с.

3. Справочник по Искусственному Интеллекту, кн. 2. Методы и модели. под ред. Д.А. Поспелова. М.: Радио и связь, 1990, с. 143-149

4. Журавлев А.П. Языковые игры на компьютере. М.: Просвещение, 1988, 144 с.

5. POLIGLOT - Пакет языковых игр. Описание. Центр Учебных Программ Московского Института Новых Технологий Образования. Москва, 1993.

6. Лахути Д.Г., Пархоменко В.Ф., Маргаритов Л.И. и др. Русский филолог. Программный пакет. М., АО Агама, 1993.

7. СЭТС система разработки электронных толковых словарей для русского языка. Каталог выставки "Интеллект-СОФТ'96". - М.: НТК "МЕТОД", 1996, с.19.

8. А.Н. Заслонко, Н.С. Новикова, Г.К. Хахалин. Лингвистическая трансляция элементов ЕЯ-текста: эллиптические и сложные предложения. Материалы конференции "Развитие интеллектуальных возможностей современных и перспективных ЭВМ". - М.: МДНТП, 1988, с. 90-94.

9. Г.К. Хахалин. Общение с вычислительными системами на естественном языке. В кн. Е.С. Кузин, А.И. Ройтман, И.Б. Фоминых, Г.К. Хахалин. Интеллектуализация ЭВМ. Кн. 2 серии "Перспективы развития вычислительной техники" - М.: “Высшая школа”, 1989, с. 93-132.


ADOUT STRUCTURE OF THE ACTIVE SYSTEM FOR RUSSIAN LANGUAGE EDUCATION

G.K.Khakhalin, D.N.Chestnaja


The structure elements of the active education system for Russian language is described. They given schoolchildren to be more active in education process. The necessary components are considered: linguistic games, various vocabularies and dictionaries, spelling and grammar correctors, linguistic analyzer and synthesizer etc.


Работа опубликована в Труды Международного семинара "Диалог'98" по компьютерной лингвистике и ее приложениям, М., 1998, с. 860-866
еще рефераты
Еще работы по разное