Реферат: Мир перевода №2(4) • 2000 лаборатория переводчика


МИР ПЕРЕВОДА №2(4) • 2000

ЛАБОРАТОРИЯ ПЕРЕВОДЧИКА

Юлиан ТИССЕН,

Генеральный директор компании LinguoBusiness,

(С.-Петербург)

E-mail: tiss@online.ru

ИНТЕРНЕТ в работе переводчика1

Еще каких-нибудь пять лет назад Интернет в России был не более чем модным словом, по­лузагадочной технической новинкой, пришедшей с Запада вслед за мобильными телефонами, пейджерами и прочими ноутбуками и лэптопами, при этом было не вполне понятно, какая, собственно, от него может быть польза простому смертному. Компьютерная сеть по определе­нию была владением "компьютерщиков", хранителей тайн конфигураций и протоколов связи, которые могли с помощью лишь им одним известных пассов переправить электронное письмо на другой берег Атлантики.

Сейчас ситуация во многом изменилась: электронной почтой никого не удивишь, каждая уважающая себя фирма либо уже имеет, либо планирует открыть собственный сайт, инвести­ции в отечественные Интернет-компании измеряются миллионами долларов, число пользова­телей устойчиво растет.

Тем не менее, приходится констатировать: российские переводчики использую! возможности этой уникальной информационной среды лишь на доли процента. Число российских подписчиков списка рассылки Lantra-L не превышает нескольких десятков, на сайте Aquarius зарегистрировано не больше двух-трех сотен резюме, слово Google мало кому что-то говорит, а о возможности соз­дать за пару дней на жестком диске своего компьютера проиндексированный корпус текстов на за­данную тему объемом 5-10 миллионов слов не подозревает почти никто.

Публикацией этого материала мне бы хотелось привлечь внимание коллег к теме использо­вания Сети в повседневной работе переводчика, поделиться накопленным в этой области опытом и тем самым положить начало обсуждению этой весьма актуальной, на мой взгляд, проблемы на страницах журнала.

Переводчик в силу самой специфики своей работы оказался в эпицентре порожденного XX веком информационного взрыва. К концу столетия, однако, выход из кризиса, похоже, най­ден: на смену Гутенбергу явился Интернет.

Фантастический рост популярности Интернета во всем мире не случаен. В его основе - дей­ствительно беспрецедентные возможности Сети. В первую очередь, это ее глобальность, даю­щая возможность моментального обмена информацией между людьми, находящимися на раз­ных концах планеты. Во-вторых, ее открытость: создать свой сайт может каждый, благодаря чему всего за несколько лет Сеть стала виртуальным отражением реального мира, вобрав в се­бя все хорошее и все дурное, что накопило человечество. Наконец, сама структура Сети - ги­пертекст в сочетании с возможностью мгновенного поиска информации - превращает Интер­нет в уникальный инструмент, впервые дающий человеку столь широкий доступ к информации. [45]

Для профессионального переводчика Интернет также открывает чрезвычайно разнообраз­ные возможности. Если говорить коротко, для переводчика Сеть - это:

- хранилище электронных словарей, энциклопедий, глоссариев и разнообразных справоч­ных материалов;

- корпус текстов, из которого можно черпать необходимую лингвистическую ин­формацию;

- источник фоновых сведений по предметной области переводимого текста;

- вместилище специализированных переводческих и лингвистических ресурсов;

Помимо этого, электронная почта и другие средства коммуникации облегчают и ускоряют обмен информацией с заказчиками и коллегами, делая переводчика по-настоящему независи­мым, а рынок переводческих услуг - глобальным.

Наконец, Интернет как новая среда существования информации дает дополнительный им­пульс развитию перевода: возникла целая самостоятельная отрасль - перевод и локализация вэб-сайтов, и этот сегмент рынка стремительно растет с каждым годом.

Рассмотрим перечисленные возможности Сети более подробно.

1. Электронные словари, глоссарии, энциклопедии и справочники

Практически все известные издательства словарей и энциклопедий предлагают электрон­ные версии своих изданий на CD-ROM, каковые при наличии достаточных средств и терпе­ния можно приобрести и в России. Многие (Merriam Webster, Cambridge University Press, Encyclopedia Britannica, Larousse, Hachette, Meyers, Brockhaus, Langenscheidt, Русский язык, Garzanti) также предоставляют бесплатный доступ к некоторым из своих детищ через Интер­нет. Доступ к Oxford English Dictionary, Termium и Encyclopedic Larousse - платный.

Помимо громких лексикографических имен, пожалуй, главное богатство "справочной" Се­ти - несметное множество специализированных словарей и глоссариев из всевозможных об­ластей, от компьютерной терминологии и сленга биржевых маклеров до ухода за орхидеями или конного спорта, от риторических приемов и экзотических религий до терминологии винд-серфинга или кодовых названий спецопераций американских коммандос. На одном только сайте YourDictionary.com представлены ссылки на 1500 словарей и глоссариев на 230 языках.

Доступ к крупным словарям обычно предоставляется в режиме онлайн (см. глоссарий в конце статьи), большинство же специализированных словарей и глоссариев можно загрузить (скачать) на жесткий диск своего компьютера и просматривать оффлайн, т.е. отключившись от Сети.


Толковые словари и тезаурусы:

Merriam Webster's Collegiate Dictionary (www.m-w.com) - словарь и тезаурус

Oxford English Dictionary (www.oed.com) - в 20 томах, включая обновлен- ные статьи, платный онлайновый доступ ($550 в год)

^ American Heritage Dictionary (www.bartleby.com/reference) - словарь и тезаурус

WordWeb (www.netword.demon.co.uk/wweb) - скачиваемый тезаурус, основанный на семантической сети WordNet Принстонского ун-та

Wordsmyth (www.wordsmyth.net) - независимый проект онлайнового Интернет-словаря и тезауруса, спонсируемый IBM

^ Roget's Thesaurus (1911) (http://search.thesaurus.com) - классический английский тезаурус [46]

Webster's Unabridged Dictionary (1913) (http://humanities.uchicago.edu/for ms_unrest/webster.form.html)

Le Petit Larousse (http://larousse.compuserve.com/lar ousse/dico.htm) - популярный французский толковый словарь

Dictionnaire de 1'Academic Franchise (http://zeus.inalf.cnrs.fr/academie.htm)

^ Dictionnaire Universe! de la Francophonie (www.francophonie.hachette-livre.fr) – лексика всех региональных вариантов франц. языка

Meyers Lexicon (www.iicm.edu/meyers) - немецкий толковый словарь

Garzanti (www.garzanti.it) - итальянский толковый словарь

Толковый словарь Ожегова (www.agama.com/oz_demo.htm)


Англо-русские, русско-английские словари:

Multilex 2.0 (МедиаЛингва) (www.multilex.ru/online.htm www.medialingua.ru www.rambler.ru/dict/enru) - En-Ru-En словарь на основе БАРСа + 5 специализированных словарей (на CD + онлайн на сайте МедиаЛингва)

Lingvo 6.5 (Abbyy) (www.lingvo.ru/lingvo/index.asp) - En-Ru-En словарь на основе Мюл­лера + множество специализированных словарей (на CD + онлайн на сайте Lingvo.ru)

^ Словарь Смирницкого (Ru-En) (www.rambler.ru/dict/ruen) - онлайн

Polyglossum (www.ets.ru) - множество специализированных словарей (на CD, некоторые онлайн на сайте ETS)


Энциклопедии и справочные материалы:

Encyclopedia Britannica (www.eb.com www.britannica.com) все 32 тома, доп. материалы, ссылки на 125000 специально отобранных сайтов по всем темам

Microsoft Encarta (www.encarta.msn.com) - весьма популярная энциклопедия, полный онлайновый доступ, ссылки

^ Columbia Encyclopedia (www.bartleby.com/65) - американская энциклопедия среднего размера

About.com (www.about.com) - информационный портал, 650 тем, каждую ведет свой специалист - справочные материалы, статьи, ссылки

^ World Factbook 2000 (www.odci.gov/cia/publications/fact book/index.html) - ежегодное справочное издание ЦРУ с подробной информацией обо всех странах мира2

Biography.com (www.biography.com) - 25000 кратких биографий, от античных философов до современных поп-звезд

Acronym Finder (www.AcronymFinder.com) - универсальный словарь англоязычных сокращений [47]

Encyclopedic Larousse (wwwl.kleio.fr) - популярная французская энциклопедия, доступ платный ($20 / год)

^ Encyclopedic Hachette (www.club-internet.fr/encyclopedie) - французская энциклопедия

Brockhaus (www.xipolis.net) - однотомный немецкий энциклопедический словарь, онлайн

^ Энциклопедия Кирилла и Мефодия (www.km.ru) - российский справочный портал

Sokr.ru (www.sokr.ru) - отличный и постоянно пополняемый словарь русских сокращений


Компьютеры и телекоммуникации:

Microsoft Glossaries (ftp://ftp.microsoft.eom/developr/MSDN/NewUp/Glossary) - скачиваемые файлы с полным переводом пользовательского интерфейса Windows, Office, IE, OE и др. программ (меню, диалог, окна, сист. сообщения) на все европ. языки, включая русский (формат Excel)

Webopedia (www.webopedia.com) - PC and Internet terms

^ Computer Desktop Encyclopedia (www.techweb.com/encyclopedia)

Whatis.com (http://whatis.com) - The IT-specific Encyclopedia

New Hacker's Dictionary3 (Jargon File) (www.tuxedo.org/-esr/jargon) - скачиваемый cловарь компьютерного сленга и культуры программистов и хакеров

FOLDOC (Free On-Line Dictionary of Computing) (http://foldoc.doc.ic.ac.uk/foldoc/contents.html) - скачиваемый словарь компьютерных терминов


Многоязычные словари:

Кембриджские двуязычные словари (http://wordreference.com) - среднего размера (En-Fr-En, En-De-En, En-It-En, En-Esp-En)

LOGOS (www.logos.it) - многоязычный словарь итал. переводческ. Агентства LOGOS, пополняется его сотрудниками и по­сетителями сайта (7,5 млн. слов на 184 языках)

Travlang.com (http://dictionaries.travlang.com) - небольшие словари, 16 языков, перевод осуществляется через посредство эсперанто - онлайн плюс скачиваемая программа Ergane)


Терминологические словари:

EURADICAUTOM (ЕС) (http://eurodic.ip.lu/cgi-bin/edicbin/EuroDicWWW.pl) - универсальный терминологич. словарь (36 предметных областей, все языки ЕС + латынь) [48]

Termium (Канада) (www.translationbureau.gc.ca/pwgsс_internet/english/03_tools/03_termium.htm) - универсальный англо-франц. терминол. cловарь с толкованиями значений по каждой отрасли - на CD и онлайн (доступ $25/мес.)


Списки специализированных словарей и глоссариев:

YourDictionary.com (www.yourdictionary.com) - 1500 словарей на 230 языках

OneLook Dictionaries (www.onelook.com) - метапоиск по 630 проиндексированным словарям, список ссылок

Mabercom (www.mabercom.com) - аннотированный список английских и французских справочников и глоссариев по различным от-раслям знаний, советы

^ Translator's Site du Jour (http://home.ncia.com/~slarsson/sitejour.html) - периодические подборки новых ссылок на глоссарии в Сети, архив старых выпусков, советы

Большой интерес представляют также словари сленга, идиом, англо-американских различий, справочники по грамматике, стилю и многие другие материалы, ссылки на которые молено най­ти на приведенных выше сайтах.


2. Лингвистический поиск в Интернет

При всем многообразии словарей и энциклопедий ценность Интернета для переводчика да­леко не исчерпывается справочными ресурсами. Фактически вся совокупность размещенных в Сети страниц представляет собой колоссальный корпус текстов, охватывающий собой все мыслимые темы. Современные поисковые системы позволяют весьма эффективно использо­вать его для лингвистических изысканий.

Здесь имеет смысл сказать несколько слов о принципах работы поисковых систем. Каждая такая система представляет собой обширную базу данных, в которой хранятся копии вэб-страниц, размещенных на миллионах сайтов по всей Сети. Программа-робот (web crawler) по­стоянно пополняет эту базу, путешествуя по Всемирной паутине и переходя от страницы к странице, от сайта к сайту по гипертекстовым ссылкам. Все найденные страницы автоматиче­ски индексируются, что и позволяет в дальнейшем мгновенно находить нужную информацию: при получении запроса пользователя программа уже не просматривает сотни миллионов страниц, а находит ключевые слова в алфавитном индексе и выдает ссылки на страницы, где эти слова присутствуют.

Использование поисковых сайтов позволяет очень быстро, порой всего за несколько ми­нут, найти ответы на самые разнообразные вопросы и справиться с многочисленными перево­дческими проблемами, которые раньше были неразрешимы без обращения к носителю языка или к специалисту в той или иной предметной области. Все это позволяет радикально повы­сить качество перевода, особенно при переводе текстов с родного на иностранный язык - что в России, особенно в сфере делового перевода, происходит едва ли не чаще, чем перевод с иностранного на родной, - а также в тех областях, где идет постоянное обновление термино­логии: компьютеры и телекоммуникации, бизнес и финансы, СМИ, международные отноше­ния, фармацевтика и многих других. Кроме того, даже самый опытный переводчик, делаю­щий переводы только на родной язык и только в той области, в которой он специализируется уже 20 лет, с неизбежностью и регулярно встречает неизвестные ему термины из смежных об-[49] ластей, загадочные сокращения, неологизмы, профессиональный сленг и т.д. - то, чего днем с огнем не найти даже в самых современных словарях.

В этой ситуации Интернет - настоящий подарок для переводчика. Ему больше не нужно изобретать велосипед или судорожно вспоминать, есть ли среди его знакомых специалист по вентиляторам и системам кондиционирования. Ему достаточно войти в Сеть и набрать не­сколько ключевых слов в поисковой системе - и вся терминология у него перед глазами. Глав­ное, что для этого необходимо - владение эффективными технологиями поиска.

Итак, несколько конкретных советов. Во-первых, для целенаправленного поиска лингвис­тической информации следует пользоваться не популярными порталами (такими как Yahoo или AltaVista, предлагающими попутно узнать результаты последних бейсбольных матчей, погоду в Бостоне, приобрести страховку или выиграть $1.000.000 в Интернет-казино), а спе­циализированными поисковыми сайтами, лучшим из которых по всем параметрам является Google (www.google.com).


Преимущества поисковой системы Google

- Исключительная точность попадания благодаря интеллектуальному алгоритму поиска: нужный сайт практически всегда если не в первой пятерке, то на первой странице

- Выдает только релевантные страницы - минимум мусора и повторов

- Самый широкий охват Сети - более 1 млрд. страниц (в 2 раза больше, чем у AltaVista)

- Под каждой ссылкой приводится фрагмент текста, в котором встретилось ключевое слово - по контексту сразу становится ясно, то ли это, что нужно

- Молниеносная быстрота работы: большинство запросов укладывается в 5 сек.

- Все проиндексированные страницы кэшированы (если страница в данный момент не дос­тупна на исходном сайте, ее можно скачать с сайта Google

- Простота и удобство интерфейса: без лишних "наворотов", без рекламы, ничто не отвлека­ет, поисковая страница загружается мгновенно

Типичные переводческие проблемы и эффективные методики поиска

1) У вас есть вариант перевода, но вы хотите его проверить. Например, можно ли переводить "лопарит" как loparite, "роллтрейлер" как "roll trailer", "солодовня" как malthouse, а "рас­ширение сознания" как consciousness expansion. Набрав соответствующие ключевые слова на сайте Google (словосочетания заключаются в кавычки), вы получите ответ.

2) Этот же метод позволяет проверить написание имени собственного или название учреждения.

3) У вас нет готового варианта перевода (как будет "докачка файла" по-итальянски или spyware по-французски?) либо ваш вариант не нашел подтверждения (malthouse - не­большая солодовня при пабе, а не современное предприятие). В этом случае вам необ­ходимо найти тексты соответствующей тематики, где велика вероятность обнаружить нужный термин. Ключевыми словами будут, соответственно, "download manager", securite Internet, Baltika malt или Soufflet Baltika (речь идет о солодовне, построенной "Балтикой" совместно с Soufflet). При этом практически все поисковые системы позво­ляют в режиме "расширенного поиска" (advanced search) ограничить область поиска каким-либо определенным языком (скажем, только сайты на испанском) или доменной областью (например, адреса на .са означают, что сайт находится в Канаде, на .ch - в Швейцарии, и т.д.).

4) Поиск по ключевым словам также позволяет быстро найти образец документа, который вам предстоит переводить (договор аренды - ключевые слова "rental agreement", решение суда о праве воспитания ребенка - "family law" и затем поиск нужного документа на спе­циализированном сайте). [50]

5) Этот же метод позволяет найти конкретный документ (Декларация прав человека, EU Data Protection Directive) или художественное произведение, из которого вам нужно при­вести точную цитату («Божественная комедия» Данте, тексты песен Beatles или Высоцко­го, "Криминальное чтиво" Тарантино, параллельные тексты Библии или Дао-дэ-цзин - в сети есть практически все). Ключевые слова: автор + название, либо фрагмент цитаты.

6) Выбрав определенный язык или доменную область, вы также можете проверить, употреб­ляется ли, например, данный англицизм в немецком языке или данный американизм на Британских островах (.uk). Если нет, то велика вероятность, что он тем не менее вам попа­дется в глоссарии с переводом на нужный язык. Набрав найденный эквивалент в окне по­иска, вы сможете посмотреть на особенности его употребления, типичные контексты или просто почитать материалы по нужной тематике.

7) Если вы введете в окно поиска интересующий вас термин и добавите слово English (или, соответственно, Anglais, Inglese), вы можете найти страницу, содержащую данный термин и имеющую ссылку на аналогичную страницу на английском языке.

8) Если вам нужно быстро найти толкование незнакомого термина, но вы не знаете, где най­ти глоссарий по данной теме, начать стоит с OneLook (см. выше), а если это не помогло, введите искомое слово в окно поиска на Google и добавьте слово Glossary или Dictionary.


Общие рекомендации по работе с поисковыми системами

Используйте несколько ключевых слов

- Используйте ключевые слова с более узким или более широким значением (в зависимости от того, слишком много или слишком мало результатов поиска вы получили) Используйте синонимы

- Читайте Help, Searching Tips и т.п. на поисковых сайтах (синтаксис запросов отличается от системы к системе)

- Используйте логические операторы (+, -,"") и маски (*, %)

- Используйте расширенные возможности поиска (advanced search)


Поисковые системы, на которые стоит обратить внимание

Northern Light (www.northernlight.com) - поиск научных и справочных материалов, СМИ

Ask Jeeves (www.askjeeves.com) - запросы на естественном языке, быстро находит базовую информацию по теме

AltaVista (www.altavista.com) - много дополнительных функций

Hotbot (http://hotbot.lycos.com) - много дополнительных функций

Dogpile (www.dogpile.com) - метапоиск одновременно по многим поисковым сайтам

^ FAST (www.ussc.alltheweb.com)- новая быстро растущая поисковая система


Российские поисковые системы:

Апорт4www.aport.ru

Rambler www.rambler.ru

Yandex www.yandex.ru [51]

Все российские поисковые сайты поддерживают морфологизацию, т.е. находят ключе­вые слова вне зависимости от того, в какой грамматической форме они употреблены на той или иной странице. Лидером по популярности и охвату русскоязычной Сети является Rambler, no удобству для лингвистического поиска - Апорт, для максимального охвата ресур­сов Рунета имеет смысл использовать все три системы.

Поиск на других европейских языках стоит начать с сайта Yahoo, имеющего нацио­нальные версии почти для всех европейских стран. Оттуда по ссылкам можно найти и другие специализированные системы поиска на том или ином языке.


Советы по поиску в Интернете

Search Engine Watch (http://searchenginewatch.com) - советы, ссылки, обзоры, тесты, новости, статистика

^ About.Com Searching Guide (http://websearch.about.com/internet/websearch/mbody.htm) - советы, обзоры, ссылки

CNet Ultimate Guide to Search (www.cnet.com/internet/0-3817-7-1922932.html) - советы, ссылки, тесты

Translator's Site du Jour (http://home.ncia.com/~slarsson/sitejour.html) - советы, ссылки


3. Тематический поиск в Сети.

Вторым наиболее популярным методом поиска в Интернете является использование каталогов (directories), в которых ссылки на ресурсы Сети распределены по многочисленным рубрикам и подрубрикам, начиная от самых общих (Бизнес, Наука, Развлечения) и заканчи­вая узкоспециальными. Самым известным таким каталогом, безусловно, является Yahoo, од­нако он уже отнюдь не является монополистом. Более того: по всем основным параметрам -удобство и четкость классификации, релевантность и быстрота обновления ссылок, широта охвата - Yahoo в настоящее время уступает своему более молодому конкуренту - Open Directory Project, созданному усилиями 32000 редакторов по всему миру. После его интегра­ции с Google пользоваться им стало особенно удобно. Заслуживает внимания и быстро расту­щий каталог LookSmart (он же используется на сайте AltaVista), однако практикуемая им про­дажа позиций в листинге сайтов отчасти снижает его ценность.

Тематические каталоги позволяют быстро найти несколько крупных специализирован­ных сайтов, которые способны дать общее представление об интересующей вас теме и послу­жить "трамплином" для дальнейших изысканий.

Netscape Open Directory Project / Google (http://directory.google.com http://dmoz.org) – 2.200.000 сайтов

Yahoo (www.yahoo.com)- ок. 1.900.000 сайтов

LookSmart(www.altavista.com www.looksmart.com) - ок. 2.000.000 сайтов [52]


Русскоязычные каталоги

@rus www.atrus.ru

List.ru www.

list.ru

Yandex www.yandex.ru

Russia Online www.online.ru/rmain

Russia on the Net www.ru

InfoArt Stars www.stars.ru


4. Корпусная лингвистика

Следующим шагом в освоении ресурсов Интернета может стать целенаправленное формирование специализированных корпусов текстов на жестком диске вашего компьютера. Современные средства позволяют быстро сформировать весьма обширный (несколько десят­ков миллионов слов) корпус текстов практически по любой тематике, и сделать это может ка­ждый, кто владеет основными навыками работы с ПК и с Интернетом. Для создания корпу­сов, помимо обычных браузеров, используются т.н. оффлайновые браузеры и программы до-качки. Полнотекстовый поиск по накопленным материалам осуществляется с помощью спе­циализированных программ индексации и поиска.


Преимущества специализированных корпусов

1) Вы сами - а не поисковая система - определяете, что именно вы хотите проиндексировать. Здесь следует иметь в виду несколько моментов:

a) Индексы поисковых систем очень обширны, вас же может интересовать употреб­ление того или иного слова в текстах строго определенного типа (американские юридические документы или английские памфлеты XVII в.)

b) Не все сайты индексируются на 100%: ограничения на глубину индексирования на­кладываются по разным причинам как владельцами поисковых систем, так и вла­дельцами сайтов. Такие сайты, тем не менее, поддаются скачиванию оффлайновы-ми браузерами.

c) Существует феномен т.н. "невидимой Сети" (invisible Web): все большее число сай­тов переходит от статического формирования вэб-страниц к динамическому и размещает всю основную информацию в базах данных. Страницы в этом случае фор­мируются "на лету" в зависимости от запросов или "профилей" пользователей; этот метод также очень удобен для сайтов с постоянно обновляемой информацией (новости, развлечения и т.д), однако большая часть материалов при этом стано­вится недоступной для поисковых машин, которые в результате как бы скользят по поверхности. Такие сайты могут содержать уникальную информацию, которую вполне можно сохранить на жестком диске вручную или с помощью программы докачки.

d) Все основные поисковые системы имеют т.н. "stop lists", т.е. списки сверхчас­тотных слов (the, and, is, to), которые не подлежат индексации. Переводчика же зачастую интересуют особенности употребления выражений, содержащих такие служебные слова. [53]

2) Профессиональные поисковые программы предоставляют гораздо более широкий на­бор функций, чем онлайновые поисковые системы: поиск с заданным интервалом между ключевыми словами, варианты интерпретации дефиса, многочисленные логические опе­раторы и маски, "нечеткий поиск" (fuzzy search), одновременный поиск по нескольким корпусам и проч.

3) Наличие корпуса на жестком диске, естественно, не требует выхода в Интернет. Переход от одного результата поиска к другому также происходит на порядок быстрее, при этом все результаты поиска автоматически подсвечиваются.


Технические рекомендации

1) Для формирования корпусов текстов лучше всего использовать популярный оффлайновый браузер ^ Teleport Pro. В тех случаях, когда сайт не поддается автоматическому скачиванию, ин­тересующие вас материалы можно загрузить вручную, используя программу докачки ReGet или ее аналоги.

2) Для индексации и поиска информации можно рекомендовать программу dtSearch (ее полнофункциональную демо-версию можно бесплатно скачать из Интернета: www.dtsearch.com/download.html). Программа поддерживает все основные типы файлов (htm*, doc, txt (ANSI и ASCII), xls), индексирует zip-архивы с минимальной потерей скорости, может работать с любыми языками на основе латиницы, с кириллицей и греческими шрифта­ми. Платная версия также поддерживает формат pdf.


Источники материалов для создания корпусов

Новостные сайты содержат самые свежие материалы на все мыслимые темы, а также архивы за последние 5-6 лет; идеально подходят для создания большого общелингвистическо­го корпуса. Следует, однако, иметь в виду, что у многих изданий доступ к архивам платный, другие предоставляют бесплатно номера за последние 7-14 дней плюс многочисленные тема­тические подборки.


Англоязычные СМИ о России

Moscow Times5 (www.moscowtimes.ru)6 - ежедневно, текущий номер бесплатно, архив платный

^ St. Petersburg Times (www.sptimes.ru) - дважды в неделю, те же условия

The Russia Journal (russiajournal.com) - еженедельно, бесплатно www.

Yahoo News Russia (http://headlines.yahoo.com/FulLCo verage/World/Russia) - ежедневный дайджест материалов о России в международной прессе, масса ссылок

Russia Today (www.russiatoday.com) - новости на российскую тематику

Инопресса (www.inopressa.ru) - перевод зарубежных статей о России на русский язык


Сайты зарубежных и отечественных бумажных СМИ

New York Times www.nytimes.com

Le Monde http://tout.lemonde.fr

Washington Post www.washingtonpost.co

Liberation www.liberation.fr

Los Angeles Times www.latimes.com

Le Figaro www.lefigaro.fr [54]

USA Today www.usatoday.com

Time www.time.com

Newsweek www.newsweek.com

Fortune www.fortune.com

Forbes www.forbes.com

Business Week www.businessweek.com

Wall Street Journal http://public.wsj.com

People http://people.aol.com

Life www.lifemag.com

The Times www.the-times.co.uk

Financial Times www.ft.com

Economist www.economist.com

Daily Telegraph www.telegraph.co.uk

Independent www.independent.co.uk

Nouvel Observateur www.nouvelobs.com

Le Point www.lepoint.fr

L'Express www.lexpress.fr

Frankfurter Allgemeine www.faz.de

Handelsblatt www.handelsblatt.co

Spiegel www.spiegel.de

Stern www.stern.de

DieZeit www.zeit.de

Corriere della Sera www.corriere.it

El Pais www.elpais.es

Известия www.izvestia.ru

Коммерсант www.kommersant.ru

Новая газета www.novayagazeta.ru

Независимая газета www.ng.ru


Зарубежные и отечественные онлайновые СМИ

и информационные порталы

Yahoo News (http://dailynews.yahoo.com) - мировые новости на основных европейских языках

^ Новостные сайты ведущих телекомпаний:

CNN www.cnn.com

ВВС News http://news.bbc.co.uk

ABCNews www.abcnews.com

MSNBC www.msnbc.com

FOXNews www.foxnews.com

ZDNet(www.zdnet.com) - компьютерные новости на основных европейских языках

CNet (www.cnet.com) - компьютерные новости на английском языке

Е&Р Media Links (http://emedial .mediainfo.com/emedia) - ссылки на 12 400 СМИ по всему миру

Find Articles (www.findarticles.com) - бесплатный архив статей из 300 журналов разнообразной тематики

SMI.RU (http://smi.ru) - дайджест и каталог отечественных СМИ (4700 ссылок)

^ Национальная служба новостей (www.nns.ru) – аналитика, новости, интервью

Национальная электронная библиотека (http://nel.nns.ru) - огромный электронный архив российской периодики (500 СМИ, более 6 млн. документов, доступ платный ($0,40/документ, мин.аванс $ 40) [55]


Художественные тексты

Bartleby.com (www.bartleby.com) - отличная коллекция художествен­ной и справочной литературы на английском языке

Project Gutenberg (http://promo.net/pg) - огромная коллекция англоязыч­ных художественных и научных текстов, включая перево­ды с других языков (в формате ASCII txt)

BookHive (www.bookhive.com) - множество художественных и нехудо­жественных текстов, в т.ч. переводы (на англ.)

Bibliomania (www.bibliomania.com) - большой выбор художественной, справочной и учебной литературы (англ.)

Perseus Project (www.perseus.tufts.edu) - античные авторы на языке ориги­нала и в английском переводе

Universal Library (www.ul.cs.cmu.edu) - множество разнообразных текстов

Electric Library (www.elibrary.com) - огромная коллекция справочных, научных, художественных текстов и статей (2000 книг, 150 газет, 700 журналов) с полнотекстовым поиском (доступ платный, $10/мес., $60/год)

^ ODP/Google EText Links (http://directory.google.com/Top/Arts/Literature/Electronic_Text_Archives) - ссылки на электронные библиотеки и архивы

^ Internet Public Library (www.ipl.org/reading/books) - каталог ссылок на тексты и литературные ресурсы

Books Online (http://digital.library.upenn.edu/books) - то же

Eserver (http://eserver.org) - художественные, публицистические, науч­ные тексты, классические и современные, по 42 темам

ARTFL (University of Chicago) (http://humanities.uchicago.edu/ARTFL/ARTFL.html) - ссылки на сайты, посвященные французской литературе

^ Библиотека Максима Мошкова (www.lib.ru) - известная и об­ширная библиотека в русском Интернете (28 000 тексто­вых файлов)

Новости электронных библиотек ("Русский журнал") (www.russ.ru/krug/biblio) - обширный список библиотек, новые поступления

^ Текстовые ресурсы Рунета (www.cl.spb.ru/iptill/library) - большой список ссылок

Журнальный зал (InfoArt) (www.infoart.ru/magazine) - российские толстые литературные журналы онлайн

^ Рейтинг литературных сайтов России http://rating.rinet.ru

Drew's Script-O-Rama (www.script-o-rama.com) - англоязычные киносценарии [56]


Специализированные сайты и порталы

Find Law (www.findlaw.com) - поиск юридических ресурсов

Lectric Law Library (www.lectlaw.com) - образцы юридических документов, справочные материалы

EUR Lex (http://europa.eu.mt/eurlex/en/index.html) - параллельные тексты официальных документов ЕС на языках всех стран-членов

Legifrance (www.legifrance.gouv.fr) - французский юридический портал

^ International Monetary Fund (www.imf.org) - МВФ

FreightGate (www.freightgate.com/referenсе) - справочная информация по экспорту/импорту и международным перевозкам

Для переводчика немалый, интерес представляют также готовые одно- и многоязычные корпусы текстов, доступные в режиме онлайн через Интернет:

TIS Corpus (http://tis.consilium.eu.int/isowebtis/welcomeEN.htm) - параллельные тексты разнообразной доку- ментаций ЕС на нескольких (от 2 до 11) языках

TransSearch (www-ali.iro.umontreal.ca/TransSearch) - двуязычный конкордансер к корпусу Hansard 1986-93 (стенограммы заседаний канадского парламента на английском и французском языках)

Wordtheque (итал. перев. агентство Logos) (www.wordtheque.com) - корпус худож. и нехудож. текстов, 112 языков, 530 млн. слов

^ Bank of English / COBUILD (Birmingham Uni/Collins) (http://titania.cobuild.collins.co.uk) - noполняемый корпус совр. языка, 320 млн. слов, онлайн - 56 млн., доступ платный (JSO/мес., 1300/год)

^ British National Corpus (Oxford University) (http://info.ox.ac.uk/bnc) - 100 млн. слов современного языка, онлайн доступ (160/год) и на CD-ROM (J 220)


Сайты, посвященные вопросам корпусной лингвистики:

W3-Corpora Project (http://clwww.essex.ac.uk/w3c) - справочные материалы, ссылки, кон- кордансер к текстам Project Gutenberg

Corpus Linguistics (www.ling.lanes.ac.uk/monkey/ihe/linguistics/contents.htm) - E-book by Tony McEnery and Andrew Wilson (University of Lancaster)


5. Переводческие и лингвистические сайты

Помимо перечисленных выше ресурсов в Сети имеется множество собственно переводче­ских и лингвистических сайтов, содержащих большое количество ценной информации.

Во-первых, это базы данных переводчиков и переводческих агентств, позволяющие перево­дчикам получать заказы через Интернет с другого конца света, а заказчику - быстро находить переводчиков требуемой квалификации. К этой категории примыкают также списки рассыл­ки, посвященные деловым аспектам перевода, в первую очередь, с точки зрения независимых [57] переводчиков (freelancers): заказы, вакансии, профессиональная этика, проблемы платежей и неплатежей, организация собственного бизнеса, маркетинг и т.д.

Немало полезной информации можно найти на сайтах переводческих агентств, переводче­ских ассоциаций и отдельных переводчиков. Это, в первую очередь, советы по организации работы, ссылки на Интернет-ресурсы, компьютерные программы, новости и многое другое.

Незаменимым средством обмена опытом между переводчиками и источником самой свежей ин­формации являются разнообразные средства интерактивного общения: списки рассылки, форумы, чаты и телеконференции. Здесь можно бросить клич о помощи, если не удается найти перевод ред­кого термина или возникла проблема с компьютером, посоветоваться, как действовать в той или иной ситуации с клиентом, поделиться наболевшим, обменяться ссылками на глоссарии в Сети, обсудить терминологию, вовремя узнать о новом компьютерном вирусе и т.д.

Лучшим и наиболее универсальным переводческим списком рассылки является Lantra-L. Это немодерируемый список, поэтому объем трафика очень высок (более 100 сообщений в день), и если в данный момент вы не ведете активной переписки, удобнее получать все сооб­щения один раз в сутки единым блоком (digest mode).

Помимо Lantra-L существует множество специализированных рассылок, посвященных от­дельным аспектам перевода, отдельным языкам, а также вопросам использования популяр­ных систем "переводческой памяти" и других средств автоматизации перевода (Trades Workbench, Deja Vu, Star Transit и др.).

Наконец, большой интерес представляют разнообразные лингвистические ресурсы, особен­но в сфере терминологии, лексикографии и компьютерной лингвистики.


Переводческие ресурсы

Aquarius (http://aquarius.net) - старейший переводческий портал, база данных пе­реводчиков и агентств (бесплатная регистрация), новости, форумы, ссылки

ProZ (www.proz.com) - быстро растущий конкурент Aquarius'a, пока уступа­ет по размеру базы данных, но превосходит по удобству пользования и уровню организации

Lantra-L (www.geocities.com/Athens/7110/lantra.htm) - универсальный переводческий список рассылки, дайджест, архив (более 1000 подписчиков, более 100 сообще­ний в день)

Jobs-Translators (www.egroups.com/group/jobs-translators) - самый популярный список рассылки, по­священный работе для переводчиков, дайджест, архив (3.500 подписчиков, ок. 10 сообщений в день)

Payment Practices (www.macroconsulting.com/payment_practices.htm www.egroups.com/group/ppjiist) - список рассылки, посвященный вопросам оплаты агентствами работы независимых переводчиков (с ка­кими агентствами стоит работать, с какими нет) - 1200 подпис­чиков, ок. 10 сообщений в день, дайджест; архив платный

Ruslantra (www.egroups.com/group/ruslantra) - относительно недавно появившаяся рассылка для переводчиков, работающих с русским языком (170 подпис­чиков, ок. 100 сообщений в день, дайджест, архив)

Список переводческих рассылок на сервере Egroups (www.egroups.com/dir/Business/Business_Services/Translation_Services)

Translatortips (www.translatortips.com) - масса полезных советов, бесплатный бюлле­тень Tranfree (ок. 10.000 подписчиков), форум [58]

^ Translation Journal (http://accurapid.com/journal/index.html) - лучший онлайновый переводческий журнал (на английском языке)

PointCom (www.geocities.com/Eureka/Office/1936) - переводческий журнал на французском языке

Cecilia Falk (www2.sbbs.se/hp/cfalk/indexeng.htm) - масса полезных аннотированных ссылок, осо­бенно в разделе Tools

Mabercom (www.mabercom.com) - масса аннотированных ссылок, глоссарии и справочные материалы

TransHub (http://transhub.cjb.net) - множество ссылок на переводческие ресурсы

^ Literary Translation (www.literarytranslation.com) - сайт Британского Совета, посвященный литературному переводу

Союз переводчиков России (http://utr.bizcom.ru)

^ American Translators Association (www.atanet.org) - имеет весьма активно работающую секцию славянских языков

Federation Internationale des traducteurs (www.fit-ift.org)


Лингвистические ресурсы

The Linguist List (www.emich.edu/~Iinguist) - отличный классификатор лингвистических ресурсов + список рассылки .

^ Human Languages Page (www.june29.com/HLP) - множество ссылок на лингвистические ресурсы

Русский указатель по лингвистике (http://isabase.philol.msu.ru/~jirik/rusling.html) - ссылки

Terminology Forum (www.uwasa.fi/comm/termino) - специализированный сайт по вопросам терминологии

^ Summer Institute of Linguistics (www.sil.org) - база данных языков мира Ethnologue (6703 языка из 228 стран, 39.000 диалектов и ва­риантов названий), научные работы, справочные материалы

World Wide Words (www.worldwidewords.org) - отличный сайт британского лингвиста и лексикографа Майкла Квиниона, список рассылки (10.000 подписчиков)

^ ALT.USAGE.ENGLISH FAQ (www.faqs.org/faqs/alt-usage-english-faq) - ответы на часто задаваемые вопросы на телеконференции по вопросам английского сло­воупотребления - множество полезной и просто интересной

^ Noam Chomsky Archive (www.zmag.org/chomsky)

Индо-европейская база данных (http://indoeuro.bizland.com/index8.html) - справочная информация по индоевропейским языкам (как живым, так и мертвым)

^ Лаборатория компьютерной лингвистики ИППИ РАН (http://proling.iitp.ru) [59]


ГЛОССАРИЙ

браузер (browser) - компьютерная программа, позволяющая просматривать вэб-страницы и обеспечивающая доступ к ряду других ресурсов (ftp-серверы, чаты и др.)

всемирная паутина, вэб, нэт (World Wide Web, WWW) - наиболее популярная часть Интернета, по­зволяющая использовать возможности гипертекста и встраивать в тек­стовые документы графику, аудио- и видеоматериалы. Состоит из вэб-страниц, связанных между собой системой гиперссылок

гипертекст (hypertext) - текст, включающий в себя перекрестные ссылки (гиперссылки), акти­вировав которые щелчком мышки можно быс
еще рефераты
Еще работы по разное