Реферат: Компьютерные словари - источник знаний

<span Arial",«sans-serif»">Министерствообразования РФ
МГТУ им. Г. И. Носова

<span Arial",«sans-serif»">Реферат
по теме: “Компьютерные словари – источник знаний”

<span Arial",«sans-serif»"><img src="/cache/referats/24373/image002.gif" v:shapes="_x0000_i1025">

<span Arial",«sans-serif»">Выполнила

<span Arial",«sans-serif»"> Нуртаева Д. Н.
группа АМ-03-1

<span Arial",«sans-serif»">Магнитогорск 2004

<span Arial",«sans-serif»;mso-fareast-font-family: «Times New Roman»;mso-ansi-language:RU;mso-fareast-language:RU;mso-bidi-language: AR-SA">

Содержание

 TOC o h zu Введение  PAGEREF _Toc68956520 h — 3-

Что такое словарь  PAGEREF _Toc68956521 h — 3-

Электронные словари  PAGEREF _Toc68956522 h — 4-

Двуязычные и многоязычные переводные словари  PAGEREF _Toc68956523 h — 6-

Служебные функции  PAGEREF _Toc68956524 h — 6-

Звук  PAGEREF _Toc68956525 h — 7-

Упражнения  PAGEREF_Toc68956526 h — 7-

Некоторые теоретические проблемы учебного компьютерноголексикографирования  PAGEREF _Toc68956527 h — 8-

Появление и развитие машинного перевода  PAGEREF _Toc68956528 h — 8-

Примеры словарей  PAGEREF _Toc68956529 h — 13-

<span Tahoma",«sans-serif»; mso-no-proof:yes">МультиЛекс  PAGEREF _Toc68956530 h — 13-

<span Tahoma",«sans-serif»; mso-no-proof:yes">Lingvo  PAGEREF _Toc68956531 h — 14-

<span Tahoma",«sans-serif»; mso-no-proof:yes">Контекст 4.0  PAGEREF _Toc68956532 h — 15-

<span Tahoma",«sans-serif»;mso-no-proof:yes">Polyglossum 1.80  PAGEREF _Toc68956533 h — 16-

Словари онлайн  PAGEREF _Toc68956534 h — 17-

<span Tahoma",«sans-serif»; mso-no-proof:yes">Словари русского языка  PAGEREF _Toc68956535 h — 17-

<span Tahoma",«sans-serif»; mso-no-proof:yes">Энциклопедические, терминологические словари и издания  PAGEREF _Toc68956536 h — 18-

<span Tahoma",«sans-serif»;mso-no-proof:yes">Иноязычные словари и переводчики  PAGEREF _Toc68956537 h — 20-

Список литературы   PAGEREF _Toc68956538 h — 22-

<span Times New Roman",«serif»;mso-fareast-font-family:«Times New Roman»; mso-ansi-language:RU;mso-fareast-language:RU;mso-bidi-language:AR-SA">
<span Arial",«sans-serif»; mso-fareast-font-family:«Times New Roman»;mso-font-kerning:16.0pt;mso-ansi-language: RU;mso-fareast-language:RU;mso-bidi-language:AR-SA;mso-bidi-font-weight:bold">
Введение

<span Times New Roman",«serif»">Насегодняшний день уже не осталось типов информации, не переведенных в цифровуюформу: тексты, музыка, видео, базы данных — все обрело свое цифровоевоплощение. Почему это делается? Да потому, что с информацией, хранящейся вцифровом виде, гораздо проще работать. Видеоиндустрия обрела средстванелинейного монтажа; музыкальные студии получили в распоряжение технологиисэмплинга и программные эффекты… А переводчики получили электронные словари.

<span Times New Roman",«serif»; mso-ansi-language:EN-US">Что такое словарь

<span Times New Roman",«serif»">АнатольФранс1 как-то остроумно заметил: «<a href=«www.rubricon.com/qe.asp?qtype=4&qall=1&aid=%7bB8EF84C3-93BC-4957-A333-E39ED9987B14%7d&id=202&fstring1=%25u043A%25u043E%25u043C%25u043F%25u044C%25u044E%25u0442%25u0435%25u0440%25u043D%25u044B%25u0439%20%25u0441%25u043B%25u043E%25u0432%25u0430%25u0440%25u044C&rq=1&onlyname=checked&newwind=&psize=10&pn=1&selw=»checked#word0000#word0000" title=«Предыдущее найденное слово»>

Словарь — это вселенная, расположенная валфавитном порядке». Его слова кажутся некоторым преувеличением, но таким ли ужбольшим? Однажды в молодости Шарль Бодлер2 начинающим поэтом пришелк уже широко известному Теофилю Готье3. В разговоре Готье неожиданноспросил: «Читаете ли вы словари?» «Да, конечно. Охотно!» – воодушевился Бодлер.И Готье стал горячо доказывать как необходимо это писателю, сколько полезногоможно почерпнуть из чтения словарей.

<span Times New Roman",«serif»">Словарииграют большую роль в современной культуре, в них отражаются знания,накопленные обществом на протяжении веков. Они служат целям описания инормализации языка, содействуют повышению правильности и выразительности речиего носителей.

<span Times New Roman",«serif»; mso-ansi-language:EN-US">

<span Times New Roman",«serif»">Вот какое определение дают словарюразные источники:

·<span Times New Roman"">        

<span Times New Roman",«serif»">Словарь– справочная книга, содержащая собрание слов (или морфем, словосочетаний, идиоми т. д.), расположенных по определенному принципу, и дающая сведения об ихзначениях, употреблении, происхождении, переводе на другой язык и т. п.(лингвистические словари) или информацию о понятиях и предметах, имиобозначаемых, о деятелях в каких-либо областях науки, культуры и другое (Новыйэнциклопедический словарь. М., 2000).

·<span Times New Roman"">        

<span Times New Roman",«serif»">Словарь,словник, словотолковник, словотолк, словарик, словарчик; словаришка; словарища;речник, лексикон; сборник слов, речений какого-либо языка, с толкованием или спереводом. Словари бывают общие и частные, обиходные и научные (Даль В. И.Толковый словарь живого великорусского языка).

·<span Times New Roman"">        

<span Times New Roman",«serif»">Словарь– собрание слов (обычно в алфавитном порядке), устойчивых выражений спояснениями, толкованиями или с переводом на другой язык (Ожегов С. И. иШведова Н. Ю. Толковый словарь русского языка).

·<span Times New Roman"">        

<span Times New Roman",«serif»">Словарь– собрание слов какого-либо языка азбучным порядком или по словопроизводствурасположенных (Словарь Академии Российской. СПб., 1806-1822).

·<span Times New Roman"">        

<span Times New Roman",«serif»">Словарь– книга, содержащая перечень слов, обычно с пояснениями, толкованиями илипереводом на другой язык. (Словарь современного русского литературного языка: в17 т.).

·<span Times New Roman"">        

<span Times New Roman",«serif»">Словарь– книга, содержащая перечень слов, расположенных по тому или иному принципу (например,по алфавиту), с теми или иными объяснениями (Толковый словарь русского языка: В4 т. / Под ред. Д. Н. Ушакова).

<span Times New Roman",«serif»">Словарипринято делить на два типа: энциклопедические и лингвистические.

__________________________________
1 – французский писатель
2 – французский поэт
3 – французский писатель и критик

<span Times New Roman",«serif»">Энциклопедические(от греч. enkyklios paideia – обучение по всему кругу знаний) словари содержатэкстралингвистическую информацию об описываемых языковых единицах; эти словарисодержат сведения о научных понятиях, терминах, исторических событиях,персоналиях, географии и т.п. В энциклопедическом словаре нет грамматическихсведений о слове, а даётся информация о предмете, обозначаемом словом.

<span Times New Roman",«serif»">Объектописания лингвистических (языковых) словарей – языковые единицы (слова,словоформы, морфемы). В таком словаре слово (словоформа, морфема) может бытьохарактеризовано с разных сторон, в зависимости от целей, объёма и задачсловаря: со стороны смыслового содержания, словообразования, орфографии,орфоэпии, правильности употребления. В зависимости от того, сколько признаковслова описаны в словаре, различают словари одноаспектные и многоаспектные.

<span Times New Roman",«serif»">Любойсловарь состоит из словарных статей. Словарная статья – это основнаяструктурная единица словаря; текст, разъясняющий заголовочную единицу в словареи описывающий ее основные характеристики. Структура словарной статьиопределяется задачами словаря. Но словарная статья любого словаря начинается сзаглавного слова [по-иному: заголовочное слово, лемма, черное слово (отполужирного шрифта, которым обычно выделено заглавное слово)]. Совокупностьзаглавных статей образуют словник, или левую часть словаря.

<span Times New Roman",«serif»">Праваячасть словаря – та, в которой объясняется заголовочная единица. Правая частьтолкового словаря, как правило, включает зоны: грамматическая характеристикаслова, толкование, тип значения (прямое, переносное); иллюстрации (цитаты,речения); словообразовательное гнездо; так называемая «заромбовая» часть(фразеологизмы) и др. Зоны правой части разрабатываются для каждого словаря.Совокупность всех словарных статей образует корпус словаря. Кроме корпуса, влюбом словаре есть предисловие, раздел «Как пользоваться словарем» (которыйпочему-то никем не читается); список условных сокращений и др.

<span Times New Roman",«serif»">Словарнаястатья в толковом словаре – это портрет слова. Чтобы правильно этот портретвоспринимать, надо уметь читать словарную статью, извлекая из нее всюзаключенную в ней информацию.

<span Times New Roman",«serif»">Словари– непременная часть личной библиотеки интеллигентного человека. Если подбордругой литературы определяется нашей профессией, вкусами, склонностями, тословари нужны всем и всегда. Их листают любопытные дети, причем преподавателиговорят, что чтение словарей «от нечего делать» – очень полезноеразвивающее занятие. Без словарей невозможно обойтись ни школьнику, нистуденту. Специалисты разных профилей заглядывают в них по миллиону поводов. Идаже самые опытные переводчики, знающие иностранный язык, как родной, садясь заработу, все равно обкладывают весь рабочий стол словарями.

Электронные словари

<span Times New Roman",«serif»">Традиционныеталмуды, содержащие десятки тысяч слов, – огромные массивные книги, наперелистывание которых тратились часы, – стремительно уходят в прошлое.Нынешний переводчик предпочитает словари электронные, сокращающие время поисканужного слова до нескольких секунд. Качеством и количеством статей электронныесловари уже не уступают своим бумажным собратьям. Вдобавок они предоставляютмассу всевозможных инструментов: сортировку входов по различным критериям,тезаурус, перевод словосочетаний, объединение нескольких словарейспециализированной лексики в один массив слов, звуковую запись произношенияслов и многое другое.

<span Times New Roman",«serif»">Словарии сама концепция электронной книги оказались как будто созданными друг длядруга. Примерно за десять последних лет компьютерный словарь научился самнаходить нужное слово, заговорил, уместился между делом на недорогой и удобныйкомпакт-диск и начал активно помогать пользователю учиться. Сегодня наприлавках российских магазинов имеется неплохой ассортимент компьютерныхсловарей иностранных языков.

<span Times New Roman",«serif»">Любопытно,что электронные словари не производятся мультинациональными корпорациями. Мыможем пользоваться операционными системами и текстовыми редакторами отMicrosoft, но вряд ли нам когда-нибудь доведется увидеть англо-русскийэлектронный словарь этой компании. В любой стране электронные словари создаютсяи распространяются местными разработчиками — и Россия здесь не исключение. Вторуюжизнь в электронном виде получили многие известные англо-русские иангло-английские словари.

<span Times New Roman",«serif»">Однимиз таких словарей является Новый Большой англо-русский словарь (НБАРС) объемом250.000 слов под редакцией академика Ю.Д. Апресяна. Он был переведен накомпьютер компанией МультиЛексв 1996 году и с тех пор неоднократно совершенствовался. Кроме этого, впрограммной оболочке МультиЛекс имеются: англо-русский и русско-английскийсловарь под редакцией О.С. Ахмановой и Е.А.М. Уилсон (40.000 слов),англо-русский словарь В.К. Мюллера (60.000 слов), русско-английский словарь подредакцией А.И. Смирницкого (55.000 слов) и коллекции специальных словарей.

<span Times New Roman",«serif»">ИздательствоHarperCollinsPublishers представлено на нашем компьютерном рынке, по меньшеймере, тремя из них: говорящим толковым словарем на 68.000 слов, изданнымкомпанией IntenseEducational Ltd. под маркой обучающей программной системы Bridge toEnglish, толковым Collins Cobuild Student's Dictionary объемом 40.000 слов,подготовленным в сотрудничестве с чешской фирмой LangMaster ираспространяемым в России компанией Новый Диск,а также англо-русским говорящим словарем на 80.000 слов и фраз (120.000переводов), изданным в 2002 году опять-таки совместно с Intense в рамкахпроекта Bridge to English.

<span Times New Roman",«serif»">Есть нанашем рынке и вещи, не отмеченные знаменитой маркой, но популярные ираспространенные широко. Прежде всего, это Lingvo компании ABBYY Software House.Полный объем всех восемнадцати англо-русских словарей системы Lingvo составляетболее 1.200.000 статей.

<span Times New Roman",«serif»">Рекламакомпьютерных словарей в прессе обычно рассчитана не на лингвистов, и часто вней с наивным восторгом подчеркивается большой объем. Однако число слов в языкекажется бесконечным только новичку. Эпоха состязания словарей за максимумсловарной базы закончилась еще в 60-х годах; выиграл те гонки Оксфорд, следычего до сих пор заметны в самой структуре словарных статей.

<span Times New Roman",«serif»">Сучетом технических требований (словарь со всем сопутствующим сервисомжелательно уместить на одном компакт-диске) оптимальным для ученическогословаря считается объем около 80.000 слов. Для рабочего словаря пределов роста,разумеется, нет.

<span Times New Roman",«serif»">Оченьважно, что электронные словари используют последние достижения лексикографии изначительно превосходят широко распространенный англо-русский словарь подредакцией В.К. Мюллера.

<span Times New Roman",«serif»">«Мюллер»– памятник той эпохи, когда считалось, что задача двуязычного словаря — найтислову из одного языка эквивалент в другом. По умолчанию предполагалось, чтотакое соответствие существует. С тех пор лингвисты убедились, как трудно дажепросто определить что же такое слово. Слово нельзя понять без контекста икультуры или субкультуры в которой оно живет. Поэтому каждое значение вэлектронном словаре сопровождается синонимами, антонимами, примерамиупотребления, лингвистической информацией. Удобно, что, не выходя из основнойстатьи, можно открыть окошки синонимов, антонимов и так далее и изучать ихвместе. Замечательно, что в современных электронных словарях отражено пионерскоедостижение российской лексикографии – двуязычный словарь во многом становитсятолковым.

Двуязычные имногоязычные переводные словари

<span Times New Roman",«serif»">Практикасоздания двуязычных и многоязычных, а также переводных словарей существует унас с давних пор.

<span Times New Roman",«serif»">Так,один из древнейших переводных словарей – «Книга лексиконгреко-славено-латинский» Е.Славинецкого – был создан в период 1664-1676гг. Существует множество двуязычных словарей: русско-национальных инационально-русских (для народов бывшего СССР); русско-иностранных и иностранно-русских,что вызвано потребностью преподавательской практики и расширением переводческойдеятельности.

<span Times New Roman",«serif»">Всовременной словарной практике существуют филологические (т.н. общие)переводные словари, переводящие общелитературную лексику с одного языка надругой, и научно-технические, или отраслевые, переводящие специальнуютерминологию.

<span Times New Roman",«serif»">Типыобщих филологических словарей: однотомные, карманные, большие, средние,учебные.

<span Times New Roman",«serif»">Научно-технические,или отраслевые переводные словари, включают в свой словник либо термины поосновным отраслям науки и техники — т.н. политехнические словари, либо толькоспециальные или узкоспециальные термины по одной отрасли науки.

<span Times New Roman",«serif»">Созданиеучебных словарей имеет значение не только в плане развития прикладногоязыкознания; эта деятельность служит стимулом для развития теоретическойлексикографии, сформировавшейся во второй трети XX в. Первую научную типологиюсловарей предложил академик Л. В. Щерба в 1940 г.; она получила развитие втрудах как отечественных, так и зарубежных лингвистов.

<span Times New Roman",«serif»">Насколькообширны задачи в этой сфере деятельности, можно судить по следующему перечню,данному в авторитетном лингвистическом издании: «Теоретическая лексикографияохватывает следующий комплекс проблем:

<span Times New Roman",«serif»">1.<span Times New Roman"">     

<span Times New Roman",«serif»">Разработка общейтипологии словарей и словарей новых типов.

<span Times New Roman",«serif»">2.<span Times New Roman"">     

<span Times New Roman",«serif»">Разработкамакроструктуры словаря (отбор лексики, принцип расположения слов и словарныхстатей, выделение омонимов, включение в корпус словаря и в приложениянесобственно-лексикографических материалов: грамматических статей, иллюстрацийи пр.).

<span Times New Roman",«serif»">3.<span Times New Roman"">     

<span Times New Roman",«serif»">Разработкамикроструктуры словаря, т.е. отдельной словарной статьи (грамматический ифонетический комментарий к слову, выделение и классификация значений, типысловарных определений, система помет, типы языковых иллюстраций, подачафразеологии, дополнительная информация, например, этимология в толковом словареи значения слова в этимологическом, другие проблемы в зависимости от типасловаря)».Служебные функции

<span Times New Roman",«serif»">Компьютерныйсловарь стал собой, когда научился автоматически отыскивать по запросусловарную статью. Это произошло примерно в 1995-1996 годах. Сегодня работа влюбом из электронных словарей начинается с «окна поиска» – строки,где достаточно набрать слово, которое вы ищете. Именно эта не очень сложнаяфункция экономит львиную долю времени при переходе с бумажных словарей наэлектронные.

Хорошим тоном считается умение словарязапоминать страницы, которые вы открывали, и возвращаться по команде«Назад» туда, где вы побывали только что; следующим шагом можновернуться туда, где были еще раньше, и так идти по своим следам, в принципе,сколь угодно долго. Практически все словари позволяют «выписывать»нужные слова в «блокноты» или «ставить закладки».

Функция «гипертекст» столь жепроста, но более многранна в своих проявлениях. Благодаря ней все англо-русскиекомпьютерные словари фактически являются англо-русско-английскими.

Звук

В 1997-98 годах ведущие разработчикиначали озвучивать свои словари, а примерно с 2000 года компьютерный словарьобязан быть говорящим. Где-нибудь на его экране обычно размещена кнопочка сизображением репродуктора; щелкнув мышкой по ней, вы услышите, как звучитвыбранное слово. Можно сказать, что транскрипция слов с появлением электронныхсловарей потеряла былое значение. Тем не менее, она сохранена. Разработчикиучитывают, что вам, возможно, еще придется пользоваться и бумажными словарями.Если вы учитесь, то наличие транскрипции в говорящем словаре поможет вам междуделом хорошо выучить фонетические знаки — это пригодится.

Теперь – немного о самом звуке. Если дляобучающих программ зачастую требуются разные голоса, то в словаре ценится звук,надиктованный одним диктором-мужчиной от начала до конца. Особенное вниманиезвуку уделяет Collins Cobuild Student's Dictionary: в нем озвучено283.000 слов, что в совокупности составляет 50 часов дикторской речи.

В последние годы некоторые словари сталииспользовать синтезированный звук. При всем совершенстве технологий это –вариант для бедных. Использовать синтезированную речь рекомендуется только длясправки, но не для постановки произношения. Иначе – есть риск начать говорить,как синтезатор. Возможность синтеза привлекательна тем, что количествоозвученных слов технически никак не ограничивается.

Упражнения

Ряд словарей снабжен системой быстрогозаучивания новых слов. Само собой, такая система еще не превращает словарь вучебник. Однако любой курс английского построен так, что к каждому уроку даетсяпригоршня новых слов — и выучить их с интерактивным словарем намного проще.

Сами по себе словарные игры — вещьтехнически не очень сложная, их вариантов придумано множество еще вдокомпьютерные времена. Принципиально важно другое — возможность организоватьигру именно с тем набором слов, который нужен сейчас. Иначе упражнения почтибесполезны, т.к. заучивать последовательно 80.000 иностранных слов просто поалфавиту — занятие, достойное душевнобольного.

Многие словари дают возможностьпрактиковаться в произношении выбранных слов, позволяют ученику не толькозаписывать и прослушивать собственное произношение, но и сравнить график(осциллограмму) собственной речи с дикторской.

Некоторыетеоретические проблемы учебного компьютерного лексикографирования

В содержательном отношении, как известно,компьютерный словарь – это один или несколько словарных файлов, индексы к ним,описания макро- и микроструктуры этого словаря и система программ,обеспечивающих создание этой конструкции, её поддержание в рабочем состоянии,ее преобразование и обращение к ней за справками, как правило, в диалоговомрежиме или из другой программы, например, из лексикографического процессора.

В компьютерной лексикографии широкопрактикуется создание целых информационных систем, в базах данных которыхнакапливаются материалы по всем возможным параметрам описания слова, вплоть долингвострановедческого, этимологического, ономастического, ассоциативного и т.д.

Основная проблема при создании учебногокомпьютерного словаря (особенно профессионально ориентированного компьютерногословаря) состоит в достаточно адекватном учете потребностей такогоспецифического контингента пользователей как изучающие иностранный язык иреализации этих потребностей в словарном описании. Решение данной проблемыможет быть найдено на основе последовательного и целесообразного реагированияна так называемые методические запросы.

В качестве ориентира при выявлении иформулировании методического запроса может выступать потребность субъектови/или объектов педагогического процесса в тех или иных сведениях об языковыхединицах. Эти сведения реализуются в методические запросы, предъявляемые ксловарю как:

а)к лексикографическому произведению: например, метаязык словаря (привестиисчерпывающий список сокращений, условных знаков и выделений, принятых длясоответствующего словаря и т. д.)

б)к средству обучения: например, возможные методические действия со словарем (включитьв словарь системно-языковые упражнения, условно-коммуникативные упражнения,упражнения в форме игр, упражнения на освоение метаязыка словаря и т. д.)

в)к программному продукту: например, процедуры, обеспечивающие возможностьосуществления " диалога" между пользователем и компьютером (отразитьвозможность обмена с текстом – вставки и копирования фрагментов словаря и т. д.)

Появление и развитие машинногоперевода

Теоретической основой начального (конец1940-х – начало 1950-х годов) периода работ по машинному переводу был взгляд наязык как кодовую систему. Пионерами машинного перевода были математики иинженеры. Описания их первых опытов, связанных с использованием только чтопоявившихся ЭВМ для решения криптографических задач, были опубликованы в США вконце 1940-х годов. Датой рождения машинного перевода как исследовательскойобласти обычно считают март 1947; именно тогда специалист по криптографииУоррен Уивер в своем письме Норберту Винеру впервые поставил задачумашинного перевода, сравнив ее с задачей дешифровки.

Тот же Уивер после ряда дискуссийсоставил в 1949 меморандум, в котором теоретически обосновалпринципиальную возможность создания систем машинного перевода. Вскоре началосьфинансирование исследований; в 1952 состоялась первая конференция помашинному переводу, организованная логиком и математиком Й.Бар-Хиллелом.

Помимо очевидных практических нужд важнуюроль в становлении машинного перевода сыграло то обстоятельство, чтопредложенный в 1950 английским математиком А.Тьюрингом знаменитый тест наразумность («тест Тьюринга») фактически заменил вопрос о том, может ли машинамыслить, на вопрос о том, может ли машина общаться с человеком на естественномязыке таким образом, что тот не в состоянии будет отличить ее отсобеседника-человека. Тем самым вопросы компьютерной обработки естественно-языковыхсообщений на десятилетия оказались в центре исследований по кибернетике(а впоследствии по искусственному интеллекту), а между математиками,программистами и инженерами-компьютерщиками, с одной стороны, илингвистами – с другой установилось продуктивное сотрудничество.

В 1954 общественности были предъявленыпервые результаты: фирма IBM совместно с Джорджтаунским университетом (США)успешно осуществили первый эксперимент (вошедший в историю под названиемДжорджтаунского), в ходе которого система, использовавшая словарь из 250 слов играмматику из 6 синтаксических правил, осуществила перевод 49 заранееотобранных предложений.

В том же 1954 первый эксперимент помашинному переводу был осуществлен в СССР И.К.Бельской (лингвистическая часть)и Д.Ю.Пановым (программная часть) в Институте точной механики и вычислительнойтехники Академии наук СССР, а первый промышленно пригодный алгоритм машинногоперевода и система машинного перевода с английского языка на русский науниверсальной вычислительной машине были разработаны коллективом подруководством Ю.А.Моторина. После этого работы начались во многих информационныхинститутах, научных и учебных организациях страны.

Идея машинного перевода стимулироваларазвитие исследований в теоретическом и прикладном языкознании во всем мире.Появились теории формальных грамматик, большое внимание стало уделятьсямоделированию языка и отдельных его аспектов, языковой и мыслительнойдеятельности, вопросам языковой формы и количественных распределенийлингвистических явлений. Возникли новые направления лингвистической науки –вычислительная, математическая, инженерная, статистическая, алгоритмическаялингвистика и ряд других отраслей прикладного и теоретического языкознания.

В течение 1950-х годов в учебных центрахмногих стран мира были открыты отделения прикладной лингвистики и машинногоперевода. Так, в СССР такие отделения были созданы в Москве (МГУ им.М.В.Ломоносова, МГПИИЯ им. М.Тореза – ныне МГЛУ), в Минском МГПИИЯ, в Ереване,Махачкале, Ленинградском университете, в университетах Киева, Харькова,Новосибирска, ряда других городов. Исследования и разработки по машинномупереводу развернулись также во Франции, Англии, США, Канаде, Италии, Германии,Японии, Нидерландах, Болгарии, Венгрии и других странах, а также вмеждународных организациях, где велик объем переводов с различных языков. Внастоящее время исследования по МП ведутся и в таких странах, как Малайзия,Саудовская Аравия, Иран и др.

Исследования по машинному переводу засвою пятидесятилетнюю историю переживали как подъемы, так и спады. В начале1960-х годов завершился первоначальный эйфорический этап в развитии МП, чему всильнейшей степени способствовала публикация так называемой «Черной книгимашинного перевода» – доклада Специального комитета по прикладной лингвистике(ALPAC) Национальной академии наук США, в котором была констатировананевозможность создания в обозримом будущем универсальных системвысококачественного машинного перевода. Следствием этой публикации былосокращение финансирования и общее снижение интереса к проблематике МП, однакополного сворачивания исследований, в особенности теоретических,не произошло.

Новый подъем исследований в области МПначался в 1970-х годах и был связан с серьезными достижениями в областикомпьютерного моделирования интеллектуальной деятельности. Соответствующаяобласть исследований, возникшая несколько позже МП (датой ее рождения обычносчитают 1956), получила название искусственного интеллекта, а создание систем машинногоперевода было осмыслено в 1970-е годы как одна из частных задач этого новогоисследовательского направления.

Можно выделить два основных стимула кразвитию работ по машинному переводу в современном мире:

1.<span Times New Roman"">     

2.<span Times New Roman"">     

В ходе развития идей и созданияпромышленных систем машинного перевода были разработаны способы автоматическогоморфологического анализа для основных европейских языков, методыавтоматического обнаружения синтаксических структур, сформулированы требованияк семантическим компонентам систем. В рамках эффективного международногосотрудничества и обмена терминологией созданы большие автоматические словари сразнообразной лексической информацией, банки терминологических данных по разнымтематическим областям (например, словарь ЕВРОДИКАТОМ и ряд других словарей,тематика которых определялась тем обстоятельством, что практический машинныйперевод чаще всего имеет дело с научными и техническими текстами). Результатыработ по МП способствовали началу и развитию исследований и разработок в областиавтоматизации информационного поиска, логического анализа естественно-языковыхтекстов, экспертных систем, способов представления знаний в вычислительныхсистемах и т.д.

В СССР в качестве головной организации помашинному переводу был в 1974 определен Всесоюзный центр переводовнаучно-технической литературы и документации (ВЦП), взявший на себя координациюработ в масштабе страны. Под его эгидой был проведен ряд крупных международныхнаучных конференций (1975, 1979, 1983, 1985, 1989) по машинному переводу ипроблемам научно-технического перевода. В ВЦП были созданы промышленные системымашинного перевода с английского языка на русский АМПАР (на основеисследований и разработок коллектива Ю.А.Моторина), с немецкого языка нарусский НЕРПА, с французского языка на русский ФРАП, автоматическиетерминологические словари в помощь человеку-переводчику. Система АМПАРдлительное время находилась в промышленной эксплуатации; впоследствии на еебазе были созданы более эффективные системы МП для персональных компьютеровсемейства СПРИНТ. В ВПЦ была также разработана система МП с русского языка наанглийский АСПЕРА. Большой вклад в разработку промышленных систем МП был сделанленинградской общесоюзной группой «Статистика речи» под руководствомР.Г.Пиотровского, а также группами специалистов по компьютерной лингвистике вМинске (А.В.Зубов), Кишиневе (В.А.Чижаковский), Махачкале (А.И.Чапля), Чимкенте(К.Б.Бектаев), Самарканде (Х.А.Арзикулов) и др. На базе исследований инаучно-практического подхода группы «Статистика речи» были впоследствииразработаны и сейчас находятся в коммерческом использовании такие системымашинного перевода, как Stylus, Socrat и другие.

В настоящее время в Российской Федерациипродолжаются в незначительных масштабах некоторые работы по системам машинногоперевода, основанным на подходе «текст-смысл-текст», не всегда явнопроговариваемым лозунгом, которого в момент обоснования этого подхода в1960-х годов был «машинный перевод без перевода, без машин, без алгоритмов». Идеяподхода заключалась в том, что от лингвиста требуется только декларативноеописание фактов языка (т.е. лингвистическая теория, претендующая, правда, наособую точность и формализованность), а алгоритмы перевода составятпрограммист и математик. В рамках этих исследований были получены значительныетеоретико-лингвистические результаты (в частности, создана теория такназываемых лексических функций, нашедшая применение в лексикографии), однакодля создания практических систем подобного рода подход оказался недостаточноэффективным.

Все практические системы безисключения используют идею переводных соответствий, т.е. в их основе лежитмодель «текст-текст» и они реализуют краткую схему перевода. Неизмеримо выросшие за последние десятилетия возможностивычислительной техники и новые программистские подходы никак не могут помочьреализовать идеи анализа и синтеза, основанные на приоритете выявления толькосинтаксической структуры с последующим переходом к смыслу. Выявлениесодержания текста в рамках человеко-машинного интерфейса может производиться,как и во всякой прикладной задаче, только с использованием как декларативных,так и процедурных знаний и при значительной опоре на лексику. Эта точка зренияобоснована, в частности, в недавних работах отечественного специалиста попрограммированию и искусственному интеллекту А.С.Нариньяни.

За рубежом эксплуатируется целый рядсистем машинного перевода. Наиболее известной из их числа является системаSYSTRAN, разработанная и поддерживаемая компанией SYSTRAN Software Inc. ииспользуемая службой машинного перевода при комиссии Европейского союза. Даннаяслужба, объем переводов в которой составляет около 2,5 млн. страниц в год,использует систему SYSTR

еще рефераты
Еще работы по литературе, лингвистике