Реферат: «Программы лингвистического анализа текстов»



БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Выпускная работа по

«Основам информационных технологий»

Аспирантка кафедры восточных языков
Скалозубова Ольга Сергеевна
Руководители:
д. ф. н., профессор Гордей Александр Николаевич,
ст. преподаватель Воробьев Михаил Александрович

Минск – 2010 г.
Оглавление
Оглавление 3

Список обозначений ко всей выпускной работе 4

Реферат на тему:
«Программы лингвистического анализа текстов» 5

Введение 5

Глава 1. Обзор литературы 6

^ Глава 2. Методика исследования 12

Глава 3. Основные результаты 12

ВААЛ-мини 12

Пси-офис 17

Заключение 20

Список литературы к реферату 21

Предметный указатель к реферату 24

Интернет ресурсы в предметной области исследования 25

25

Действующий личный сайт в WWW (гиперссылка) 26

Граф научных интересов 27

Тестовые вопросы по Основам информационных технологий 28

Презентация кандидатской диссертации 29

Список литературы к выпускной работе 30

Приложение 33



^ Список обозначений ко всей выпускной работе
БНК – Британский национальный корпус

ИТ – информационные технологии

МК – массовая коммуникация

ОИТ – основы информационных технологий

РВБ – русская виртуальная библиотека

НК – национальный корпус

НКРЯ – национальный корпус русского языка
^ Реферат на тему:
«Программы лингвистического анализа текстов» Введение
Изначально лингвистика и информатика занимались изучением двух никоим образом не связанных, не пересекающихся областей. Однако, как пишет в своей статье «Лингвистика, прикладная лингвистика, компьютерная лингвистика» Б. Шпильнер, вхождение в нашу повседневную жизнь, научную и практическую деятельность современных компьютеров, которые стали распространены, как телефон и телевизор, стало оказывать большое влияние на лингвистику [7]. Влияние это можно наблюдать как в появлении новых методов и подходов к изучению традиционно лингвистических проблем, так и в определенном расширении сферы интереса лингвистики. Так, непосредственно на стыке информатики и языкознания возникло особое направление в языковедении – компьютерная лингвистика. Кроме этого в 50–60-е гг. XX в. на границе между лингвистикой и математикой выросла новая дисциплина – математическая лингвистика, которая активно прибегала к использованию возможностей компьютера для решения своих задач. Лингвистика стала стремиться к объективации своего знания, для чего были необходимы новые методы анализа языка, новые приемы его описания и т.д. Соответственно, все новые аспекты прикладного языкознания, появившиеся за последние 30 -40 лет, связаны с одной общей проблемой – автоматической обработкой языка в его письменной и устной формах, что представляется возможным только благодаря использованию специальных компьютерных программ.

Можно выделить три уровня отношения компьютера к лингвистике:

Первый уровень достаточно хорошо известен: это использование компьютера в обычных лингвистических работах и научных исследованиях, таких как составление конкордансов, анализ выбранного корпуса текстов, разработка грамматических моделей, исследование стиля, составление языковых текстов, статистических списков слов; отбор наиболее частотных слов в словари-минимумы и пр.

Второй уровень – применение компьютера собственно в прикладной лингвистике, где воспроизводится или моделируется языковая деятельность. Примером таких работ является машинный перевод. Здесь роль лингвистики чрезвычайно велика.

Третий уровень характеризуется на первый взгляд незначительной ролью лингвистики. Это уровень работ по искусственному интеллекту. Кажется, что здесь в диалоге «человек – машина» первое место принадлежит нелингвистическим дисциплинам; однако в той мере, в которой этот диалог происходит на естественном языке, а дело идет именно к этому, лингвистические проблемы и лингвистические знания начинают играть все большую роль.

Таким образом, связь и взаимное влияние лингвистики и информатики кажутся нам вполне очевидными.

Цель настоящей работы – рассмотреть и проанализировать некоторые возможности применения информационных технологий в разработке и исследовании традиционно лингвистических проблем, в частности в изучении прагматики отдельных слов и целых текстов.
^ Глава 1. Обзор литературы
Одной из древнейших областей человеческой деятельности в целом и лингвистики как науки является лексикография. Первые словари появились на Востоке за сотни лет до нашей эры и к XVI в. приобрели привычный для нас вид [8]. В современном же мире бумажные словари постепенно (но все более активно) вытесняются электронными, в пользу чего свидетельствует существующее множество подобных словарей, доступных как online, так и для установки на ПК. С достаточно полным перечнем электронных словарей можно ознакомиться на сайте Русской виртуальной библиотеки (РВБ): http://www.rvb.ru/soft/catalogue/c07.html. Как видим, здесь представлены не только переводные (двуязычные), но и толковые словари, и словари-тезаурусы, и специализированные тематические словари и т.д. Таким образом, сегодня потребность в получении и анализе данных словарных статей, в использовании словарей при изучении и усовершенствовании иностранного языка, при поиске устойчивых выражений или терминов и множество других потребностей, направляющих исследователя или обычного человека, изучающего язык, к словарям, могут быть удовлетворены с помощью ИТ.

Кажется целесообразным отдельно упомянуть о национальных корпусах текстов, которые на сайте РВБ отнесены в раздел «Словари и тезаурусы» (http://www.rvb.ru/soft/catalogue/c07.html). Дело в том, что корпуса текстов следует рассматривать как самостоятельные по отношению к лексикографическим источникам образования качественно иного типа. В лингвистике даже сложилось самостоятельное направление, именующееся корпусной лингвистикой, которое своим возникновением обязано распространению компьютерных технологий, ведь именно благодаря им и стало возможным составление представительных корпусов текстов.

Если еще пару десятков лет назад труд исследователя языка на определенном этапе его развития обременялся трудоемким составлением текстовой выборки, то сегодня тот или иной национальный язык во всем своем многообразии представлен в корпусе текстов. Корпус – это информационно-справочная система, основанная на собрании текстов на некотором языке в электронной форме. Национальный корпус представляет данный язык на определенном этапе (или этапах) его существования и во всём многообразии жанров, стилей, территориальных и социальных вариантов и т. п. Разметка – главная характеристика корпуса; она отличает корпус от простых коллекций (или «библиотек») текстов, в изобилии представленных в современном Интернете. Национальный корпус, в отличие от электронной библиотеки, – это не собрание «интересных» или «полезных» текстов; это собрание текстов, интересных или полезных для изучения языка. А такими могут оказаться и роман второстепенного писателя, и запись обычного телефонного разговора, и типовой договор аренды и т.п. – наряду, конечно, с классическими произведениями художественной литературы. Чем богаче и разнообразнее разметка, тем выше научная и учебная ценность корпуса. В Национальном корпусе русского языка (http://www.ruscorpora.ru/) в настоящее время используется четыре типа разметки: метатекстовая, морфологическая, акцентная и семантическая; в ближайшее время планируется внедрение синтаксической разметки.

Национальный корпус предназначен в первую очередь для обеспечения научных исследований лексики и грамматики языка, а также непрерывных процессов языковых изменений, происходящих в языке на протяжении сравнительно небольших периодов – от одного до двух столетий. Другая задача корпуса – предоставление всевозможных справок, относящихся к указанным областям (лексика, грамматика, акцентология, история языка). Современные компьютерные технологии многократно упрощают и ускоряют процедуры лингвистической обработки больших массивов текстов. Теперь ограничений на объем анализируемого материала и скорость поиска информации в нем по существу нет, а это означает, что в распоряжении исследователя оказываются колоссальные массивы текстов самого разного типа. Это не замедлило сказаться на развитии наших знаний о языке: возможность массовой – в том числе статистической – обработки текстов, недоступная прежде, позволила обнаружить в структуре и развитии языка такие закономерности, о существовании которых наука раньше или не подозревала, или лишь смутно догадывалась, но не могла строго обосновать. Теперь подлинно научные описания грамматического строя языков, а также авторитетные академические словари – практически все без исключений – должны составляться на основе корпусов этих языков. Учет корпусных данных оказывается крайне желательным (если не строго обязательным) и при многих других более специальных научных исследованиях.

С этой точки зрения основными потребителями национальных корпусов являются, конечно, исследователи-лингвисты самого разного профиля. Однако круг пользователей корпуса вовсе не ограничивается профессиональными исследователями языка. Надежные статистические данные о языке определенной эпохи или определенного автора могут интересовать литературоведов, историков и представителей многих других областей гуманитарного знания. Важное значение национальные корпуса имеют и для преподавания языка в качестве родного или иностранного. НК обращен ко всем, кто в силу профессии, по необходимости или из простой любознательности ищет ответ на вопросы об устройстве и функционировании языка, то есть фактически к большинству образованных носителей этого языка и ко всем, изучающим его в качестве иностранного.

НК создается лингвистами (специалистами по так называемой корпусной лингвистике, быстро развивающейся современной области языкознания) для научных исследований и обучения языку. Большинство крупных языков мира уже имеет свои национальные корпуса (различающиеся по полноте и уровню научной обработки текстов). Общепризнанным образцом является, в частности, Национальный корпус английского языка на него ориентированы многие другие современные корпуса. Среди корпусов славянских языков выделяется Чешский национальный корпус, созданный в Карловом университете Праги.

Еще одной традиционной областью деятельности в лингвистике является перевод текстов с одного языка на другой. Процесс перевода также был автоматизирован и сегодня в распоряжении переводчика существует целый ряд программ, специально разработанных и предназначенных для решения этой задачи: http://www.rvb.ru/soft/catalogue/c05.html. Однако стоит признать, что машинный перевод не лишен некоторых недостатков, связанных со сложностями, возникающими в процессе перевода. Компьютер не понимает языковых нюансов, намеков в тексте, того, что называется тонкой игрой слов, да и понять содержание текста в полной мере ему пока не под силу. Мышления как такового при машинном переводе не происходит: предложение расчленяется на части речи, в нем выделяются стандартные конструкции, слова и словосочетания переводятся по находящимся в памяти машины словарям. Затем переведенные части речи собираются по правилам другого языка [4].

Но этого недостаточно для полноценного перевода. В зависимости от того или иного стиля и назначения текста одно и то же слово нередко имеет разные значения. В какой-то мере эта особенность учитывается в системах машинного перевода: предусмотрены сменные словари, иногда для каждого вида текста предусмотрен свой словарь. Если лексики одного машинного словаря не хватает и применяются несколько словарей одновременно, можно указать системе, из какого словаря нужно брать слово, если есть несколько вариантов его перевода. Наконец, программа сама может предлагать на выбор пользователю несколько вариантов перевода, и он выбирает подходящий вручную. Могут возникнуть и проблемы с переводом слов в устойчивых словосочетаниях и фразеологизмах, но это вполне по силам компьютеру. На практике получившийся перевод похож на текст, написанный иностранцем. Это значит, что компьютер, сталкиваясь при переводе с проблемами языковой омонимии, полисемии, синонимии, не может их преодолеть, а установленные межъязыковые идентификации (соответствия) оказываются неверными (что обусловлено контекстом), т.е. он выбирает не те соответствия.

Дабы не продолжать подобное описание до бесконечности, отметим, что лингвисты в настоящий момент владеют значительным инструментарием для работы с языковым материалом. Так, на сайте РВБ (Русская виртуальная библиотека) размещен каталог лингвистических программ и ресурсов сети (http://www.rvb.ru/soft/index.html) [11]. Данный каталог включает в себя описание программ, связанных с анализом текстов и вычислительной лингвистикой, а также соответствующих ресурсов, доступных сегодня в глобальной сети Интернет. По словам авторов, упор при составлении каталога делался на бесплатные программы, доступные для загрузки или использования в режиме on-line. Также описаны коммерческие версии некоторых наиболее интересных программ. Тематически каталог разбит на следующие разделы:

1. программы анализа и лингвистической обработки текстов (TextAnalyst, АОТ и др.);

2. программы преобразования текстов (TextTransformer, XReplacer);

3. психолингвистические программы (ПСИ-Офис, ВААЛ-мини);

4. генераторы текстов (RWC);

5. системы обработки естественного языка и машинного перевода (Автоматический словарь Мультитран, Google Переводчик);

6. каталоги и коллекции ресурсов (Каталог программ по вычислительной лингвистике, Справочно-информационный портал "Русский язык", LTI Projects, The Linguist List);

7. словари и тезаурусы (ФЭБ словари, словари Ожегова и Зализняка, WordNet, толковый словарь Merriam-Webster);

8. поисковые машины и системы полнотекстового поиска (ARM Engine, Convera Retrierval Ware);

9. системы синтеза и распознавания речи (Sakrament Text-to-Speech Engine, Text-To-Speech Converter for MS Word, BookMania).

Это перечень лишь некоторых программ, которые могут быть использованы лингвистами при обработке текстов.

Насколько широко применяются компьютерные программы в самых разнообразных лингвистических целях можно судить по материалам, представленным на официальном сайте международной конференции по компьютерной лингвистике «Диалог»: http://www.dialog-21.ru/. А с учетом того, что размещенная на сайте информация – это лишь «капля воды в лингвистическом море», можно только представлять себе, какую огромную роль играют ИТ в лингвистических исследованиях на современном этапе.
^ Глава 2. Методика исследования
В процессе работы основным методом, к которому мы прибегали, был сравнительный метод. Кроме того, немаловажную роль в исследовании сыграли метод формальной логики и системно структурный методы.
^ Глава 3. Основные результаты
Так как в последнее время достаточно большое внимание уделяется изучению языкового воздействия на сознание индивида или групп индивидов, особое место среди компьютерных программ занимают психолингвистические программы анализа текстов, перечень которых представлен на сайте РВБ http://www.rvb.ru/soft/catalogue/c02.html. Помимо этого описание некоторых из них, в том числе тех, о которых пойдет речь ниже, можно найти на сайте Psyberia.ru http://psyberia.ru/soft/softlingvo, автором которого является психолог Вит Ценев.
ВААЛ-мини
Итак, с появлением компьютера появились и новые возможности анализа языка. В 1992 году группа энтузиастов объединилась для работ по изучению и компьютерному моделированию скрытого воздействия текстов на человека. Результатом их работы является проект, получивший название ВААЛ. Сегодня в сети доступна бесплатная версия программы, найти которую можно на официальном сайте проекта: http://www.vaal.ru. На этом сайте можно ознакомиться с историей проекта, его эволюцией, а также найти массу другой полезной информации. К сожалению, сегодня доступна лишь демоверсия, которая предлагает ограниченную часть из предусмотренных функций: анализ эмоциональной оценки отдельных слов или целых текстов. Так, для полноты представления перечислим возможности, предоставляемые полной версией программы:

оценка неосознаваемого эмоционального воздействия фонетической структуры слов на подсознание человека;

генерирование слова с заданными фоносемантическими характеристиками;

оценка неосознаваемого эмоционального воздействия фонетической структуры текстов на подсознание человека;

задание характеристики желаемого воздействия и целенаправленная корректировка текстов по выбранным параметрам в целях достижения необходимого эффекта воздействия;

оценка звуко-цветовых характеристик слов и текстов;

проведение словарного анализа текстов;

осуществление полноценного контент-анализа текста по большому числу специально составленных встроенных категорий и категорий, задаваемых самим пользователем;

производство выделения тем, затрагиваемых в текстах, и осуществление на основе этого автоматической категоризации;

проведение эмоционально-лексического анализа текстов;

настраивание на различные социальные и профессиональные группы людей, которые могут быть выделены по используемой ими лексике;

проведение вторичного анализа данных путем их визуализации, факторного и корреляционного анализа.

Таким образом, возможности программы заметно шире того, что предложено в демоверсии, однако отметим, что фоносемантическая оценка слов и текстов имеет важное значения для анализа коммуникативных установок и целей адресанта, а также для оценки и интерпретации эффектов, производимых тем или иным сообщением на аудиторию. В основе оценки эмоционального воздействия фонетики слова и текста на подсознание человека лежат результаты докторской диссертации А.П.Журавлева. Они нашли отражение в его книгах “Фонетическое значение”, ЛГУ, 1974 и “Звук и смысл”, М, 1981.

Так, особый интерес представляет соответствие между значением слова и его звуковой формой, опирающееся на способность звука вызывать незвуковые представления. По мнению разработчиков системы ВААЛ, единственно возможный путь описания звуковой символики – перечисление оценочных признаков. Соответственно, для оценки фоносемантического воздействия в системе ВААЛ-мини используется 24 шкалы, представленных парами антонимичных прилагательных русского языка: хороший - плохой, красивый - отталкивающий, радостный - печальный, светлый - темный, легкий - тяжелый, безопасный - страшный, добрый - злой, простой - сложный, гладкий - шероховатый, округлый - угловатый, большой - маленький, грубый - нежный, мужественный - женственный, сильный - слабый, холодный - горячий, величественный - низменный, громкий - тихий, могучий - хилый, веселый - грустный, яркий - тусклый, подвижный - медлительный, быстрый - медленный, активный - пассивный. Вот каким образом представлены эти шкалы в окне системы:



Нами был проведен анализ слов, вводящих цитаты в общий текст новостных статей. По его результатам можно видеть, что, например, слово утверждать производит впечатление чего-то храброго, слово отмечать – чего-то доброго; в слове говорить доминируют признаки чего-то грубого и мужественного; а в слове считать – чего-то тихого; а вот слово сказать не обладает ярко выраженными фоносемантическими характеристиками, что свидетельствует о его наибольшей нейтральности. Так, можно судить о том, что даже выбор слова, вводящего цитируемый элемент, может оказаться значимым для общего эффекта, производимого сообщением на слушателя / читателя.

Помимо фоносемантической оценки слова программа ВААЛ-мини предусматривает еще и фоносемантическую оценку целых текстов. Как и в случае с оценкой отдельного слова, для фоносемантической оценки текста используется 24 пары антонимичных прилагательных. Два антонима представляют как бы два противоположных полюса оценки:

если в тексте преобладает оценка левого прилагательного, рисуется красная полоска влево от центральной числовой оценки;

если преобладает оценка правого прилагательного, рисуется синяя полоска вправо от центральной числовой оценки;

если же оценка отличается от нейтральной в пределах погрешности измерений, то она представлена темно-серым цветом.





Нами был проанализирован ряд новостных сообщений о состоянии экономики, опубликованных на сайте РИА-новости в декабре 2009 г. Несмотря на то, что на эксплицитном уровне в текстах статей сообщалось об убытках, ослаблении рубля, неутешительных прогнозах и т.д., имплицитно тексты имели в целом положительные характеристики, как, например, хороший, светлый, величественный, активный, подвижный и ряд других. Это позволяет сделать вывод о том, что, хотя представители агентства стремятся к объективному отражению ситуации и, соответственно, освещают негативные стороны современного положения экономики, все же тексты ориентированы на положительную реакцию со стороны читателей, возможно, даже на их успокоение. Так программа способствует выявлению коммуникативных намерений авторов статей (даже не всегда осознаваемых самими авторами).

Таким образом, программа ВААЛ-мини кажется нам полезной для людей, занимающихся изучением влияния информации, представленной в разных формах, на массовое сознание или сознание отдельных индивидов, а также для тех, кто стремится предсказать, предугадать возможные реакции на его сообщения.
Пси-офис
Еще одним эффективным инструментом в руках исследователя прагматики сообщений является программа Пси-офис, разработчиком которой является Вадим Сысуев. Программа Пси-офис состоит из трех самостоятельных модулей. Первый предназначен для поиска повторяющихся фрагментов текста, второй исследует любой предложенный текст на предмет вложенных в него слов и фраз, которые могут оказывать неосознаваемое влияние. Третий модуль помогает синтезировать подсознательные компоненты текста по предложенному слову или фразе. Получить бесплатную версию программы можно на следующих сайтах: http://psy-two.narod.ru/, являющемся личным сайтом разработчика программы, и http://psyberia.ru/soft/softlingvo, на котором представлен еще и краткий обзор и анализ программы.

Нас особенно заинтересовали два модуля программы: поиск повторяющихся фрагментов текста и поиск «вложенных слов». Первый модуль, а именно модуль поиска повторяющихся фрагментов текста позволяет находить частые повторы, оценивая их «полезность» и адекватность тексту. Модуль автоматически генерирует несколько отчетов для всестороннего представления полученных данных: по алфавиту, по встречаемости в исследуемом тексте и по длине. Сам модуль (как и весь комплекс в целом) прост и незатейлив в использовании: настроек у него мало, интерфейс вполне понятен.



Необходимо лишь указать ссылку на текст, который нужно изучить, затем нажать кнопку «Начать поиск», и все отчеты появятся в том же месте, где лежит сам текст.

Аналогичен принципу управления модулем поиска повторов и принцип управления модулем поиска вложенных слов. Вложенными словами можно вполне эффективно пользоваться: так, например, чтобы говорить про зло бессознательно, достаточно часто упоминать в тексте такие слова, как, к примеру, козлов, развезло, повезло, узлом и т.д. Модуль поиска исследует предложенный текст на предмет подобных вложений. Ни одна из комбинаций не пройдет мимо, чему способствует огромный словарный запас (почти 700000 слов).



Отчет строится автоматически по алфавиту, по количеству в тексте и по длине. Многие вложения могут показаться совершенно бессмысленными, так как программа находит и такие слова, которые могут оказаться не просто нерелевантными по отношению к теме исследования, но даже и незнакомыми исследователю, при этом, однако, достаточное их количество может быть значимо для исследования.

Нам кажется вполне целесообразным сочетать результаты анализа текста в обоих модулях: так, наиболее значимыми кажутся те вложения, которые повторяются хотя бы пару раз, а еще более значимы вложенные слова, относящиеся к одному и тому же тематическому полю. Представим нашу интерпретацию результатов анализа новостной статьи под названием “Wake up, gentlemen…” (“Проснитесь, господа…”). В целом статья отражает кризисное положение финансовой сферы и кратко рассматривает возможные пути выхода из кризиса. Отметим, что в тексте нет, на наш взгляд, избыточных повторов: фрагмент “bank” повторяется 21 раз, “financ” – 9 раз, “econom” – 7, что в общем отражает тематику статьи. К значимым вложениям нами были отнесены следующие компоненты: sure – уверенный, tribute – дань, положение должника, vice – зло, порок, risk - риск (в то время как к множественным, по нашему мнению, незначимым вложениям были отнесены такие компоненты как add – добавлять, pose – позировать, поза, prise – награда и мн.др.). При этом в статье доминируют негативно окрашенные вложения и повторы (как tribute – дань, положение должника, vice – зло, порок, risk - риск, problem – проблема, crisis - кризис): порядка 75% против оставшихся 25%, которые приходятся на долю позитивно окрашенных или нейтральных вложений. Таким образом, результаты анализа позволяют сделать вывод о том, что статья сориентирована в первую очередь на постановку проблемы и ее актуализацию в сознании адресатов.

Приведенные нами примеры подтверждают тот факт, что компьютеризация исследовательского процесса делает гораздо более обоснованными выводы даже в таких нечетких сферах языкознания, как прагматика речевого общения. При этом основным плюсом применения компьютерных программ в исследованиях самых разнообразных областей лингвистики, и интересующей нас сферы в частности, является значительное возрастание скорости обработки данных, а также возможность обработки и анализа значительных массивов текстов.
Заключение
Постольку, поскольку программное обеспечение позволяет выполнять многие виды работ и анализа в сфере лингвистики, компьютер является инструментом обработки данных, каналом, через который проходит поток информации, преобразовываясь, трансформируясь и вскрывая определенные закономерности, выявляя результаты анализа [15]. Таким образом, на службе у современной лингвистики стоит компьютер с массой возможностей, которых у науки о языке на более ранних этапах ее развития попросту не было. Современные компьютерные технологии многократно упрощают и ускоряют процедуры лингвистической обработки больших массивов текстов. Сокращение времени, затрачиваемого на выполнение тех или иных исследовательских процедур, приводит к возможности достижения более весомых, более значимых результатов, ведь многое из того, на что ранее требовались годы, сегодня возможно за некоторые часы, что позволяет сконцентрировать силы на решении задач более высокой степени сложности. Помимо этого ИТ способствуют объективации лингвистического знания, его верифицируемости.

Лингвистические технологии находят множество областей применения, начиная с несложных программ проверки орфографии, до более изощрённых алгоритмов, используемых в поисковых системах, программах автоматического реферирования, машинного перевода, экспертных системах [5]. Таким образом, на службе у исследователя-лингвиста стоит целый ряд компьютерных программ, позволяющих проводить самые разнообразные операции с языковым материалом.

Не осталась «обделенной» в этом смысле и область психолингвистических исследований, связанных с воздействием транслируемой информации на сознание адресатов. Лингвисты владеют значительным инструментарием для анализа подобных эффектов, причем применение ИТ при разработке подобных проблем способствует значительному снижению фактора субъективности.
^ Список литературы к реферату
Баранов, А. Г. Функционально-прагматическая концепция текста/ Ростов н/Д: Изд-во Рост. ун-та, 1993. – 180 с.

Британский национальный корпус [Электронный ресурс]. – Режим доступа: http://www.natcorp.ox.ac.uk/. – Дата доступа: 10.12.2009.

Вайнрих, Х. Лингвистика лжи/ Х. Вайнрих //[Электронный ресурс]. – Режим доступа: http://www.pr-omgu.info/parts/docs/003.doc. - Дата доступа: 10.11.2009.

Васильев, А. Компьютер на месте переводчика/ А. Васильев// [Электронный ресурс]. – Режим доступа: http://www.ets.ru/arc07-r.htm. – Дата доступа: 29.11.2009.

Виноград Т. Работа с естественным языком // Современный компьютер. – М., 1986.

Всеволодова, А. В. Применение ИТ при обучении лингвистов/ А. В. Всеволодова// [Электронный ресурс]. – Режим доступа: http://ito.edu.ru/2003/I/2/I-2-2429.html. – Дата доступа: 6.12.2009.

Звегинцев В.А. Теоретическая и прикладная лингвистика. – М., 1968.

Зотов, А. Ф. Современная западная философия/ А. Ф. Зотов// [Электронный ресурс]. – Режим доступа: http://www.i-u.ru/biblio/archive/sotov_modzapphil/08.aspx. - Дата доступа: 10.11.2009.

Зубов А.В. Информационные технологии в лингвистике: Учебное пособие для студентов лингвистических факультетов высших учебных заведений. – М.: Издательский центр «Академия», 2004.

Зубова И.И. Информационные технологии в лингвистике: Учебное пособие. – МГЛУ. – Мн., 2001.

Кибрик А.Е. Очерки по общим и прикладным вопросам языкознания

Лингвистический энциклопедический словарь. – М., 1990 (и последующие издания).

Марчук Ю.Н. Основы компьютерной лингвистики. – М., 2000.

Марчук Ю.Н. Проблемы машинного перевода. – М., 1983.

Марчук, Ю. Н. Прикладная лингвистика и компьютер/ Ю. Н. Марчук. – М., 1992. – 41 с.

Маслов Ю.С. Введение в языкознание. – М., 1975.

Межкультурные взаимодействия в полиэтничном пространстве. Сборник материалов международной научной конференции// [Электронный ресурс]. – Режим доступа: illh.krc.karelia.ru/sbornik.pdf. – Дата доступа: 10.12.2009.

Национальный корпус русского языка [Электронный ресурс]. – Режим доступа: http://www.ruscorpora.ru/. – Дата доступа: 10.12.2009.

Пиотровский Р.Г. Лингвистический автомат в исследовании и непрерывном обучении. – СПб., 1999.

Пиотровский Р.Г. Лингвистический автомат и его речемыслительные обоснования: Учебное пособие. – Мн., 1999.

Прикладное языкознание: Учебник. – СПб., 1996.

Сайт Вадима Сысуева [Электронный ресурс]. – Режим доступа: http://www.psy-two.narod.ru. – Дата доступа: 16.12.2009.

Сайт международной конференции по компьютерной лингвистике «Диалог» [Электронный ресурс]. – Режим доступа: http://www.dialog-21.ru/. – Дата доступа: 10.12.2009.

Сайт проекта ВААЛ [Электронный ресурс]. – Режим доступа: http://www.vaal.ru/. Дата доступа: 11.12.2009.

Сайт РВБ [Электронный ресурс]. – Режим доступа: http://www.rvb.ru/soft/index.html. - Дата доступа: 10.12.2009.

Psyberia.ru – авторский проект психолога Вита Ценева [Электронный ресурс]. – Режим доступа: http://www.psyberia.ru/. – Дата доступа: 11.12.2009.

Thieberger, N. Computers in field linguistics/ N. Thieberger// Encyclopedia of Language and Linguistic. Volume 7/ Ed.-in-chief K. Brown. – NY, 2006. – p.780-783.
^ Предметный указатель к реферату
В

ВААЛ · 11, 12, 14, 15, 16, 22

И

Интернет · 7, 10, 25

и

информатика · 5, 32

к

компьютер · 10, 20, 21, 22

компьютерная лингвистика · 5

компьютерные технологии · 8, 20

К

Корпус · 7

л

лексикография · 6, 28

лингвистика · 5, 21, 22, 27, 28

м

математическая лингвистика · 5

машинный перевод · 6, 9

модуль · 17

п

прагматика · 20

П

Пси-офис · 17

Р

Разметка · 7

ф

фоносемантическая оценка · 13



^ Интернет ресурсы в предметной области исследования
http://www.dialog-21.ru/ – ежегодная международная конференция по компьютерной лингвистике.

http://www.franklang.ru/ – мультиязыковой проект Ильи Франка.

http://www.helpforlinguist.narod.ru/ – информационно-образовательный портал для лингвистов, переводчиков и всех, кто интересуется языком.

http://lingvoforum.net/ – форум для лингвистов, филологов и просто изучающих языки.

http://ru.wikipedia.org/ – многоязычный проект по созданию полноценной и точной энциклопедии со свободно распространяемым содержимым.

http://scipeople.ru/ – научная сеть.

http://translate.google.ru/ – Google Переводчик.

http://www.twirpx.com/ – электронная библиотека (монографии, диссертации, книги, статьи, конспекты лекций, рефераты, учебники).

http://www.vak.org.by/ – сайт Высшей аттестационной комиссии Республики Беларусь.

http://uztranslations.net.ru/ – первый мультиязыковой портал для переводчиков, филологов, лингвистов, студентов, преподавателей и просто людей, интересующихся изучением и занимающихся преподаванием иностранных языков.
^ Действующий личный сайт в WWW (гиперссылка)
http://skalozubova-olga.narod.ru/
Граф научных интересов
аспирантки Скалозубовой О.С.
Факультет международных отношений
Специальность теория языка

Смежные специальности


10.02.02 – Русский язык

Лексикология. Семасиология. Фразеология. Парадигматические и синтагматические связи в лексико-семантической и фразеологической системах русского языка. Слово и фразеологизм в национальной языковой картине мира. Функциональная лексикология. Когнитивная лексикология и фразеология.

Грамматика. Описательная, функциональная и ономасиологическая грамматика. Грамматика слова и коммуникативная грамматика. Сопоставительная грамматика.

Лингвопрагматика, этнолингвистика, лингвокультурология. Прагматика речевого общения. Речевой этикет. Языковая, социокультурная, коммуникативная компетенция. Этнические стереотипы. Национальные образы мира. Взаимодействие языка и культуры. Лингвокультурологическая компетенция. Гендерная лингвистика.




10.02.20 – Сравнительно-историческое, типологическое и сопоставительное языкознание

Соотношение между языками без учета их генетических связей; фонетко-фонологические и просодические свойства языков; типологические закономерности в морфологии и
еще рефераты
Еще работы по разное