Реферат: Русско-болгарский электронный словарь сэд как вариант интегральной лексикографической системы

Русско-болгарский электронный словарь СЭД как вариант интегральной лексикографической системы


(Словарь – это то, что мы знаем о слове)


Термином “электронный словарь” в настоящее время уже трудно кого-либо удивить. При всем при этом единого мнения на то, что следует считать электронным словарем, нет, не было и, на наш взгляд, быть не может. Как и сами словари, смысл, вкладываемый в это понятие, является авторским и отражает то видение вопроса, которым располагает лексикограф, его опыт, знания и даже профессиональную принадлежность [Ларченков].


На славянской лексикографической карте появился еще один островок. Новый электронный русско-болгарский сопоставительный словарь имен экспансивных действий1 (сокращенно - СЭД) находится в начальной фазе разработки. Казалось бы, о словаре в таком младенческом возрасте преждевременно говорить как о событии в масштабах славянской лексикографии. Однако концепция этого словаря, его структура и интерактивная среда нетрадиционны: их обсуждение перекликается с поиском адекватных теоретических предпосылок для создания интегральных двуязычных словарей нового поколения в принципе. СЭД - первый в славянской двуязычной электронной лексикографии действующий образец словаря, который одновременно

является вариантом ответа на вопрос о возможных перспективах слияния достижений сопоставительной лингвистики и компьютерной лексикографии в новый двуязычный продукт – интегральный словарь.

Взамен алфавитного организационного принципа и традиционной линейности словарной статьи предлагает структуру системных отношений лексической эквивалентности.

Представляет лексические эквиваленты в комбинированной двунаправленной словарной статье, названной страницей словаря.

Прослеживает динамику эквивалентных связей (иррадиацию эквивалентов) в виде цепей лексических пар, члены которых синхронизированы в своих значениях.

Совмещает словари (толкования, синонимы, ассоциации, фразеологизмы) на одной словарной странице.

Является словарем-реактором, в котором переплетаются функции справочника, средства для разработчика, узла для активного участия читателей в правке страниц, средства для прямого участия в блогах и форумах, автоматического включения и обновления лент новостей, архива ссылок и текстовой базы данных, регистра комментариев и онлайн-связи разработчиков.

Показывает читателю смысловые поля во взаимосвязи, в динамике и многообразии отношений многозначных слов в двух языках.

Включает многочисленные обработанные и адаптированные для читателя примеры из национальных корпусов.

Дополняет лексикографическую интерпретацию когнитивным “паспортом” слова или группы эквивалентных слов.

Является браузером для просмотра внешних ссылок и материалов, опубликованных в сети Интернет.

Является открытым словарем (open source).

Вряд ли можно утверждать, что действующая модель словаря СЭД является инвариантным решением многих теоретических и прикладных вопросов современной двуязычной лексикографии. Категориальный аппарат словаря ориентирован на близкородственные языки, какими в данном случае являются русский и болгарский. Тем не менее, словарь по характеру является сопоставительным, параллельным, двусторонним, активным, а все перечисленные выше особенности позволяют определить его как интегральный двуязычный словарь. Позиция подобного словаря в типологии словарей оказывается далеко не праздным вопросом, в связи с чем мы хотели бы обратиться прежде всего к терминологии.


^ Букетная терминосистема


Представляется, что устойчивость терминологии не должна быть самоцелью в условиях любой динамично развивающейся отрасли: по логике мышления категориальный аппарат запаздывает, следует изменениям и по идее должен быть достаточно гибким, чтобы не противоречить самому себе в ближайшем будущем. Словарь – это понятие, но отнюдь не категория. Наглядным примером диффузии понятий может быть нарочито упрощенная постановка следующих вопросов.

Является ли WordNet словарем (лексиконом) или базой данных, онтологией (тезаурусом,) или сетью слов и понятий, связанных смысловыми отношениями (network of meaningfully related words and concepts)? Является ли FrameNet электронным лексикографическим продуктом, непохожим на словарь? На какой словарь? Является ли электронный словарь словарем или программой, выполняющей функции имитации словаря? Является ли выравнивание параллельных электронных текстов на разных языках лексикографическим трудом технически и в плане конечной цели и задачи? Память переводов (translation memory), используемая в системах типа Trados и DejavuX, оперирует сегментами разной длины, называемыми “единицей перевода”. А что является единицей перевода в, скажем, итальянско-русском фразеологическом словаре? Возможно общее определение: (электронный) словарь – это продукт, который удовлетворяет следующим требованиям... Достаточно сузить или расширить круг требований, чтобы расшатать само определение.

Мы не хотели бы в данном исследовании говорить собственно о разнобое в лексикографической терминологии или об отсутствии иногда адекватного взаимопонимания между лексикографами разных стран (см. краткое изложение вопроса в работе [Карпова: 2001]). В отличие от типологии языков, типологическая классификация словарей является куда более приблизительной. Она нуждается в периодическом пересмотре не потому, что она неверна. Во-первых, она просто недостаточна, поскольку складывалась в эпоху доминации словарей-книг и не могла предвидеть массового смещения центров лексикографических исследований в сторону сети Интернет, появления новых направлений в лексикографии.

Во-вторых, исходное понятие словаря существенно изменило свой объем и свою референтную область. ^ Новый объяснительный словарь синонимов русского языка, разработанный под руководством Ю. Д. Апресяна, – ярчайший пример вдумчивого, нестандартного лексикографического подхода к семантике. Нынешние представления о киберлексикографии [см. Карпова, Менагаришвили: 2002; Carr: 1997] выглядят сегодня обещающим проспектом, но вполне возможно, что в ближайшем будущем киберлексикография станет одним из основных направлений лексикографических разработок [см. Krestova, Nürnber: 2004].

В-третьих, наблюдается явное изменение в климате взаимоотношений лингвистов и лексикографов, с одной стороны, и массовое участие квалифицированных читателей в популярных международныx проектax типа Wiki – с другой:

In the digital age, access to the same internal and external resources needed for compiling linguistic data is available to both professionals and non-professionals; as a result, the title of “expert” may simply be a convenient term to describe whichever group has greater facility with these resources [Penta: 2011].

Этот небезболезненный для “традиционного” лексикографа процесс дополняется выдвижением на передний план программистов и дизайнеров, специалистов по корпусной лингвистике и ряда других профессиональных фигур, в том числе – в сфере маркетинга и публикации.

В-четвертых, хотя лексикографическое и энциклопедическое описания одного и того же слова подчеркнуто разнонаправленны, нет никаких препятствий к тому, чтобы лексикографическое описание стремилось к “энциклопедичности” по охвату, так сказать, в первичном смысле этого слова, на что указывает бурное развитие лингвистической теории концептов (об универсальном словаре концептов см. [Диконов, Богуславский: 2008]), исследование языковой картины мира и лингвокультурология в целом.

Мы принимаем естественность сложившегося положения вещей. По-видимому, букеты терминосистем, которые складываются стихийно, в угоду той или иной теории, автора, тенденции - меньшее из зол. Проблема заключается в слабой конвергенции накопленных знаний в виде интегральных продуктов, пусть несовершенных по известным причинам, но ставящих начало новой, полезной для читателя ветке лексикографической идеологии “Словарь – это то, что ты знаешь о слове”.

Возможно, словари могли бы делать более внятным то обстоятельство, что лексические единицы открывают доступ к когнитивным доменам, существующим по независимым основаниям, вместо того, чтобы просто предлагать краткие дефиниции [Langacker: 2005].


^ Словарь – это то, что мы знаем о слове


В 2003 году на X конгрессе МАПРЯЛ в Санкт-Петербурге болгарский лексикограф А. Липовска выступила с интереснейшим докладом “Об идее создания русско-болгарского словаря нового типа”. Была представлена концепция электронного словаря, имеющего модульную организацию, большое количество параметров лексикографического описания эквивалентов в сопоставительном плане, совершенно новую структуру словарных статей. В проспекте отмечались богатые возможности для пользовательского управления элементами словаря [Липовска: 2003, Липовска 2009]. Значимость этой информации для славянской лексикографии трудно переоценить. Однако исследования А. Липовской и ее коллег до настоящего времени не удалось воплотить в электронный проект в силу непреодолимости двух препятствий, которые А. Поликарпов по другому поводу коротко охарактеризовал так:

- разрозненность усилий различных коллективов исследователей в решении сходных задач (поиски оптимальной структуры баз данных и интегральных лексикографических систем; синтез лексикологических и лексикографических задач и методов при создании новых машинных словарей; и т.п.);

- отсутствие достаточного финансирования перспективных лексикографических проектов [Поликарпов: 2002].

По-видимому, такая ситуация сохранится, особенно если рассматривать европейскую интеграцию многих государств не только как исторический, но и культурный феномен смены приоритетов. Тем не менее, идея сопоставительного двуязычного словаря нового типа привлекательна по простой причине: такой словарь может сказать больше о слове.


^ Переводной и сопоставительный


Переводной словарь является реляционным: его объект не тождествен одному языку, средством интерпретации языка А выступает другой произвольно взятый язык В, который может быть в свою очередь описан языком А (однонаправленные переводные словари). Объектом микроструктуры словаря являются номинально лексемы, однако по сути выстраивается бинарное отношение выражения смыслов. Это отношение рефлексивно, оно устанавливает подобие и как правило не может быть сведено к эквивалентности типа слово – слово:


Фиг 1. Схематическое представление однонаправленного двуязычного словаря



По традиции в двуязычных словарях как правило не выясняется отношение (см. фигуру) эквивалентности слов во всем многообразии его проявлений. Это ни в коем случае нельзя считать пропуском словарей в силу однонаправленного (диверсивного) переводческого подхода к единицам языка. Асимметрия правой и левой частей статьи переводного словаря как правило повторяет асимметрию слова и толкования его значений в толковом словаре. Вопрос об отношении, связывающем эквиваленты в двуязычном словаре косвенно “решается” в основном тремя путями: а) апелляцией к интуиции читателя; б) негласным допущением, что типовые отношения эквивалентности – прерогатива лингвистики, а не лексикографии; в) встречным двуязычным словарем, который переводит асимметрию в противоположную сторону.

Таким образом, “на выходе” статьи переводного словаря формируется список, но не система эквивалентов, а сама процедура словаря является одношаговой. Отметим, что это значительно упрощает составление переводного словаря, особенно в его печатном варианте. Однако, отказавшись от возможности выстроить систему отношений, составитель переводного словаря умножает на количество словарных статей пассивный характер словаря и отсутствие соотнесенности его левой правой частей, не говоря об отсутствии соотнесенности прямого и обратного словарей.

Ни один русско-болгарский словарь не дает ответа на вопрос о различиях в эквивалентной связи, например, между парами лъжа – лгать, лъжа – врать, лъжа – обманывать, лъжа – вводить в заблуждение, лъжа – брехать, лъжа – объегоривать, лъжа – обводить и т.д. Между тем, каталогизация эквивалентных отношений принципиально важна: она позволяет построить комбинированную словарную статью квазирекурсивного типа, которая отражала бы динамику эквивалентных связей в виде цепей эквивалентных пар на одной и той же странице словаря. А. Липовска и ее коллеги вплотную подошли к этой идее, принимая во внимание тот факт, что техника представления эквивалентных связей допускает вариации в деталях. С присущей болгарским лексикографам педантичностью, сотрудники кафедры русского языка Софийского университета “Кл. Охридский” составили богатейшую сопоставительную картотеку, которая стала базой для ряда методических пособий [см. Червенкова, Бозова, Йотова, Ковачева, Котева, Липовска, Манолова, Павлова: 1995].

Нам удалось ознакомиться подробно с разработками болгарских коллег. Это было полезно и интересно, тем более что к идее сопоставительного русско-болгарского словаря мы шли параллельными путями и, как оказалось, контуры будущего электронного словаря во многом совпали. Тем временем, практическая реализация проекта словаря СЭД существенно продвинулась: он хорошо документирован, отлажен, проверен в разных версиях и представлен онлайн [Перванов: 2010; СЭД: электронный ресурс]2.

Итак, СЭД – это не словарь переводной, но словарь эквивалентных отношений лексики двух языков. Переводимость является одним из важных параметров наряду с другими. Никто не поставит под сомнение тот факт, что обозначения типа лгать - обманывать - придуриваться - мошенничать - вводить в заблуждение, обвесить - обмерить – обсчитать, лжец - обманщик - фальсификатор – лжесвидетель, лживые слова - обманчивый жест – фальшивая улыбка, ложь - обман – подделка и т. д. проецируют одну и ту же общую семантику. Однако ни один существующий словарь, будь то электронный или печатный, не вставит эту парадигму наименований в словарное гнездо. Причина тому проста и сложна. Простое объяснение состоит в узкой специализации словарей. Сложность, как правило, связана с идеологией словаря (т.е. с лингвистической концепцией) и выбором подходящей интерактивной оболочки для контакта с пользователем. В словаре СЭД лексические системы двух языков рассматриваются не как алфавитно упорядоченные списки слов и выражений, а в их взаимосвязи с наивной картиной мира носителя языка, с тем, как языковые значения отражают некоторую "подъязыковую" психосемантическую реальность, названную схемой экспансивного действия3. Мы условно назвали представленную в словаре макрогруппу имен "аттрактивной агрессоршей". Присутствие этой группы слов в языке играет первостепенную роль в обозначении нюансов взаимоотношений между людьми. Сверхзадача словаря - дать возможно более глубокое описание русских и болгарских слов не просто в сопоставлении, а в познавательном аспекте.

Предложенная ниже схема словарной страницы (статьи) является иллюстрацией логики представления эквивалентных связей слов в русском и болгарском языках. Мы используем лингвистические критерии, которые в переводном словаре являются избыточными в силу его алфавитной организации. Алфавитный принцип в словаре СЭД является не организующим, а всего лишь поисковым. Организующим принципом словаря СЭД является синхронность (симметрия) - асинхронность (асимметрия) эквивалентной связи двух или более слов. Это значит, что словарная страница должна воссоздать "портрет" группы эквивалентов с указанием начала (узловая пара), ветвей (соположенных пар), типа эквивалентного отношения для каждой пары и значений, по которым слова объединяются в пару.

^ Фиг. 2. Схема структуры страницы ЛГАТЬ – ЛЪЖА.





Без всякой специальной подготовки любой читатель сделает как минимум восемь заключений:

1. Слова лгать и лъжа (скорее всего) связаны по смыслу, т.е. имеют какое-то общее значение, но сходны также по написанию. Они стоят в заголовке и отмечены одинаковыми синими прямоугольниками (идеограмма).

2. Слова следующей строки обращены в сторону, они сгруппированы в новые пары, а значит, лгать и лъжа связаны по смыслу не только друг с другом. Это многозначные слова. Новая иконка (диагонально срезанный прямоугольник) отличает эти пары от заголовочной.

3. На каждой строке: слова (скорее всего - значения слов) всегда организованы попарно.

4.На третьей строке повторяются признаки заключения (1): внешнее сходство членов пар, смысловая связь и синяя идеограмма. Эти пары слов могли бы в другой ситуации стоять в заголовке, подобно паре лгать- лъжа.

5. Болгарские и русские слова появляются с обеих сторон диаграммы.

6. Пара лъжа - вводить в заблуждение не является парой слов. Не хватает пары лгать - вкарвам в заблуда. Иконка (две прилепленные окружности синего цвета) другая.

7. За вычетом повторов, каждая скользящая вертикальная цепочка (лгать - клеветя - клеветать - набедявам или лъжа - обманывать - мамя, или обманывать - изневерявам - изменять) чем-то (скорее всего - по смыслу) связана с парой в заголовке.

8. Все слова имеют какое-то связующее значение.

Разумеется, количество заключений условно. Такая словарная статья непохожа на абзац словарной статьи в традиционном словаре, но весьма правильно отображает то, как слова двух языков соотносятся в реальности, а не в плоском формате текста. Отметим, что в интерактивном варианте значения членов пар синхронизированы и доступны щелчком мыши.


^ Цветовая гамма словаря и идеограммы


Идеограмма в общем случае представляет собой значок, картинку и может являться элементом графического интерфейса пользователя в данном электронном приложении. Смысловая нагрузка идеограммы варьирует от простого индикатора до классификатора материала. Настоящий словарь впервые вводит в практику славянской двуязычной электронной лексикографии графические символы, призванные оптимизировать прочтение страниц, стимулировать воображение читателя и классифицировать эквивалентные связи слов в двух языках. Идеограмма в словаре используется в первичной функции - как изображенное понятие эквивалентных связей слов.

Визуальная часть словарной страницы, в частности, использование идеограмм для символизации видов эквивалентных соотношений слов, является важной. Очень часто лингвисты используют набор терминов, взятых из логики, например, пересечение понятий, включение, тождество и т.д. Для разработки массового двуязычного словаря они мало пригодны, а сопровождающие картинки как правило лишены самого наглядного признака - цвета. Словарь СЭД использует "говорящее", осмысленное цветоразличение - цвет и форма картинки, скрепляющей два слова, стимулируют образное мышление и языковую интуицию. Цветовая маркировка изолированных толкований слов является лексикографическим приемом словаря.

В рубриках словаря и в справочных окнах русские слова всегда закрашены синим цветом, а болгарские -красным. Если слово меняет цвет с синего на оранжевый при наведении курсора мыши, это значит, что оно содержит линк (гиперссылку) и является активным.

Мы хотим обратить внимание на новую характеристику совмещенной словарной статьи: лексикографическая классификация эквивалентов по формально-смысловым признакам с учетом происхождения слов обозначена идеограммой типа эквивалентной связи. Введение идеограмм в двуязычную словарную статью имеет троякий эффект. Идеограммы “склеивают” слова в пары, являются изображенными понятиями типа эквивалентной связи и могут стать “кирпичиками” для построения словарной страницы в виде цепей эквивалентов. Они стимулируют воображение и, будучи достаточно интуитивными, в ряде случаев могут заменить полное описание. Читателю необходимо всего лишь усвоить значение идеограмм для полноценного прочтения страницы.

Типологическая классификация эквивалентов несущественна для переводных словарей (это не является их задачей), но обязательна для сопоставительного словаря. Будучи разработанной для нужд сопоставления близкородственных языков, какими в данном случае являются русский и болгарский, классификация СЭД, разумеется, не является универсальной. Внешний вид, форма и цвет идеограмм подчиняются логике сопоставительного анализа и достаточно интуитивны. Красный цвет идеограмм является предупреждением: связь между эквивалентами асинхронна или неоднозначно предсказуема.

Например, символ, объединяющий пару слов врать лъжа, означает, что в классификации эквивалентов эта пара является гетерогенной, имеет одно первичное значение и переводима безусловно. Символ, объединяющий пару лгать лъжа, означает, что пара гомогенна, идентична для обоих языков и в исходном значении слова означают одно и то же. Символ в паре заблуждавам вводить в заблуждение означает, что в языках одно и тоже понятие может иметь диффузный (в виде слова или сочетания слов) характер и общий элемент заблуждение. Синий цвет идеограмм характеризует синхронную связь значений, красный цвет обозначает асинхронные соотношения эквивалентов, иными словами, переводчик или преподаватель языка всегда сможет определить своеобразие неоднозначных соответствий слов и сделать свой выбор на базе толкований значений или примеров из языкового корпуса.

Учитывая, что в сопоставительном словаре представлены толкования слов, стилистические пометы и богатый иллюстративный материал, идеограммы могут показаться лишним элементом словаря, но это совсем не так. Во-первых, вместо двух статей в двух переводных словарях, мы создаем одну, имеющую классифицированный заголовок ВРАТЬ ЛЪЖА или ЛЪЖА ЛГАТЬ. Во-вторых, это один из немногих наглядно-экономных способов построить соотношение нескольких пар, не прибегая к отпугивающим математическим символам. Например, часто используемые символы ≡ или ↔ для обозначения эквивалентности в нашем случае непригодны, поскольку отсутствуют лингвистические критерии, этимологический признак и признак значимости первичных значений членов пар.


^ Справочная база


Справочная база дает необходимые сведения о сокращениях и толкует основные элементы страницы словаря. Она представлена на каждой странице и является незаменимой для читателя, если он по какой-либо причине не успел ознакомиться подробно с рубриками словаря. По сути информация в справочной базе является введением в словарную страницу и представляет собой часть миниатюрной “языковой лаборатории”.

Другая задача справочной базы - предоставить читателю необходимую краткую справочную информацию под чертой во избежание непрерывных отвлекающих пересылок к основному модулю Материалы к словарю. Контекстуальная помощь обеспечивает минимум сведений относительно типологии эквивалентных пар, принятых сокращений и правильного понимания идеограмм.


Фиг 3. Справочная база страницы словаря СЭД (всплывающее окно).





^ Краткие сведения о структуре страницы (статьи) словаря


Поскольку заглавная пара является узловой, в словарной статье ей посвящена вся первая строка страницы. В этой строке находятся микромодули с информацией о синонимах слова (СИН), фразеологизмах (ФР), включающих узловое слово или имеющих аналогичное значение. Выборки из национальных корпусов с примерами живого употребления слова и комментариями представлены в модулях НКРЯ (национальный корпус русского языка) и БНК (български национален корпус). Дана также ссылка на ассоциативный словарь (АСС), морфологический анализ слова (МОРФ), источники по теме (ПЗ - полезно знать). Сверхзадачей словаря СЭД является когнитивный анализ макрогруппы имен экспансивных действий в двух языках. Когнитивные комментарии к заголовочной паре представлены в модулях ТЭД (тип экспансивного действия, к которому отсылает слово) и ИР (ин ^ Узел словарной статьи
 

Понятие узла словарной статьи чрезвычайно важно. Узел может быть представлен парой слов, между которыми прослеживаются четкие отношения эквивалентности в первичных значениях и наблюдается регулярная статистика прямого и обратного перевода в разных контекстах. Узел может быть также представлен уникальным словом, для которого невозможно установить одно-однозначное отношение переводимости. Таковы, как правило, слова, обозначающие реалии, либо содержащие коннотации, оценку и стилистическую специфику (р. артачиться, б. урочасвам). Узел может быть оформлен парой слов, из которых по той или иной причине лишь одно вошло в орбиту имен экспансивных действий. Таков случай ахнуть и ахна. В общей классификации они нашли бы отражение как гомогенная пара ахнуть ахна. Русское ахнуть означает также: перех. Прост. С силой ударить. [Мирон Григорьевич], почти не размахиваясь, ахнул его по скуле. Шолохов, Тихий Дон [МАС].

Включение русских и болгарских слов в узловую пару не может быть произвольным. Первостепенными являются этимологические критерии и сходство первичных значении слов. Из списка вероятных "кандидатов" (см. схему словарной статьи выше) исключены все слова, расположенные ниже узловой пары. Иными словами, первым принципом отбора слов является наличие или отсутствие синхронной гомогенной связи.

Синхронные гомогенные пары формируются инерционным путем в обоих языках: это слова общего происхождения, не претерпевшие в исходном значении каких-либо изменений, например, лгать - лъжа, убивать - убивам, либо заимствованные позже из языка А в язык В типа грозить - грозя, либо из третьего языка в языки А и В типа фальшивить - фалшивя. Критерии:


Пара слов имеет общее происхождение, рефлексия общности прослеживается, имеет совпадающее написание (звучание) и одно первичное значение.

Пара слов может иметь разные лексикографические интерпретации, но одно первичное значение.

Пара слов "непереводима": она идентична для обоих языков и аутентична для говорящих.

Пара слов является "автосинонимом": смысл, понятие, первичное  значение автосинонима нерасчленимо в сопоставительной модели словаря.

Пара слов отсылает к одному и тому же фрагменту тезауруса, имеет один и тот же индекс результата (ИР).

Синхронная связь может прослеживаться между словами, имеющими разное происхождение либо общее, но не ощущаемое носителем языка. Русское врать является ближайшим синонимом лгать. Отношение между врать и лъжа синхронно, но пара разнородна по составу. Включение таких пар в узел словарной статьи должно учитывать смысловое своеобразие синонима. В данном случае врать имеет дополнительные значения и эквиваленты, поэтому целесообразно создание нового узла (словарной страницы). Тип эквивалентного отношения другой: врать и лъжа являются синхронными гетерогенными эквивалентами. Синхронные гетерогенные пары формируются параллельным путем в обоих языках. Чаще всего - путем дивергенции или заимствования в А или В из третьего языка, например: врать - лъжа, вешать - беся, казнить - екзекутирам. Критерии:



Пара слов имеет (но не прослеживается рефлексия общности) или не имеет общего происхождения, написание (звучание) не совпадает, но имеет одно первичное значение.

Пара слов может иметь разные лексикографические интерпретации, но одно первичное значение.

Пара слов эквивалентна: левое и правое слово обозначают одно и то же в двух языках.

Пара слов не является автосинонимом: первичное значение расчленимо в сопоставительной модели тезауруса (беся - вешать, казнить - екзекутирам).

Пара слов отсылает к одному и тому же фрагменту тезауруса, имеет один и тот же индекс результата (ИР).


Принцип синхронности первичных значений эквивалентов является определяющим. В каждом конкретном случае узловая пара является классифицированным заголовком: идеограммы служат символом типа эквивалентной связи и являются выразителем уникальности пары. Вместе с тем, классификация эквивалентных отношений была бы неполной, если бы мы исключили из рассмотрения еще несколько характерных типов связи. Каждый из них имеет прямое отношение к оформлению словарной страницы СЭД. Узел словарной статьи является также ее заголовком. Система индексации словарных статей в СЭД базируется на заголовке, который совпадает с узловым словом или парой. Кодировка словарной статьи в электронной разметке словаря использует транслитерацию:


статья ЛГАТЬ ЛЪЖА  >> lgat_lazha.htm или lgat_lazha.xml


 

 
^ Диффузные пары
 

 

Диффузные пары представляют реализованную на межъязыковом уровне возможность простого (однословного) и дефинитивного (с помощью описательных выражений) обозначения. Диффузные пары состоят из уникального слова в одном из языков и описательного эквивалента, приближающегося по значению к толкованию слова в языке оригинала. Диффузная связь является однонаправленной. Русское удить 'ловить удочкой (рыбу)' образует диффузную пару с болгарскими:

 

ловя с въдица

удить

хващам на въдицата.

 

В парах типа заблуждавам - вводить в заблуждение, удить - ловя с въдица прослеживается диффузная связь "слово - сочетание слов с общим элементом". Общий элемент может быть зримым (нефтяник работник в нефтена индустрия), синхронным (удочка - въдица), свернутым или развернутым (артиллерийский обстрел – артобстрел артилерийски обстрел), импликативным (лъжа някого вводить в заблуждение кого-л.). Диффузная связь напоминает толкование слова в языке оригинала. Она синхронна, регулярна и предсказуема, даже если развернутый эквивалент представлен в разных вариантах:

удить ловя с въдица или хващам на въдица

злоумышлять мисля зло някому или имам лошо намерение, замислям зло

 

^ Дизъюнктивные пары
 

 

В ряде случаев приходится прибегать к однословной интерпретации уникального слова. Иногда это связано с передачей коннотаций слова, содержащего оценку и относящегося к просторечному стилю. В переводе используется замена, например:

 

кокнуть ('ударить') - ударя, чукна, прасна, цапна

кокнуть ('убить') - убия, пречукам

кокнуть ('сломать') - счупя, строша

 

Как видно, отношение эквивалентности размыто и неоднозначно. Слово кокнуть образует открытое множество пар с болгарскими словами. Эффект открытого множества обозначен в словаре идеограммой дизъюнктивного (расподобляющегося, логического "или") отношения эквивалентности . Это отношение асинхронно, поскольку отсутствуют одно-однозначные соответствия. Болгарское грозя ('делать некрасивым') образует дизъюнктивные пары с русскими портить, уродовать, обезображивать. Слово урочасвам образует множественные пары с русскими портить, заговаривать, сглазить. Русское осилить образует пары: oсилить надвия или осилить победя или осилить надделея или осилить превъзмогна.


В концепции СЭД расподобляющиеся пары являются реальностью, не подлежащей четкой фиксации. Например, в паре кокнуть чукна болгарское чукна - лишь неконнотированный элемент множества. Ему, равно как и любому другому болгарскому эквиваленту в этой группе, нельзя отдать предпочтение при формировании заголовка словарной статьи. Практическое решение просто: уникальное слово самостоятельно выносится в заголовок, а структура словарной статьи отличается от других:


Фиг. 5. Структура страницы АРТАЧИТЬСЯ.




 

В синей зоне представлены синхронные эквиваленты, а в красной - асинхронные. Как мы отметили, понятие узла словарной страницы включает классифицированные пары. В случае дизъюнктивной связи пары представлены как члены эквивалентной группы:

 

грозя уродовать

грозя портить

грозя обезображивать

или





Скользящие отношения эквивалентности


Как отобразить эквивалентность врать ('клеветать') и клеветя? Значение 'клеветать' производно, маркировано предложной конструкцией (на кого-л.) и совершенным видом наврать. При условии, что синхронная пара клеветя клеветать гомогенна и определяется по первичным значениям слов, мы можем обозначить пару врать клеветя идеограммой асинхронной связи . Это другой тип эквивалентности, представляющий отношение между производным значением одного из членов пары и первичным значением другого члена на фоне третьего слова (клеветать), выравнивающего это соотношение. Красный цвет идеограммы является предупреждающим и отображает диспропорции в тройке слов. Вид идеограммы (скользящие треугольники) подчеркивает неординарный, асинхронный характер новой пары врать клеветя.

Асинхронные отношения эквивалентов в двух языках регулярны, их источником является многозначность слов и распределение (градация) значений слова в одном или другом языке. Системное отображение этого типа отношений необязательно для переводного словаря, но является определяющим в сопоставительном словаре. Включение асинхронных пар в узел словарной статьи привело бы к хаосу в системе поиска. Этого делать не нужно по той простой причине, что они детально описаны ниже заголовочной пары и по сути являются "сюжетом и драмой" словарной статьи. Благодаря скользящим эквивалентным отношениям формируются переходы от одной пары к соположенным парам, т.е. ступенчатые цепи эквивалентов, адекватное отображение которых является целью словаря.


Межъязыковые омонимы и паронимы


В словарь включены также "ложные друзья переводчика". Аналоги пар (омонимы) обозначены идеограммой . Межъязыковые паронимы обозначены идеограммой пустого знака . Ложные и пустые пары не могут образовывать страницы. По рангу они занимают самые нижние места в иерархии словарной статьи. Ложные и пустые пары должны служить предостережением для неопытного читателя или начинающего переводчика. В таких случаях необходимо внимательное прочтение словарных толкований. В некотором роде эти пары являются "фантомами" словаря, но это не означает, что они исключены из системы поиска.


Тезаурусная типология значений


Для понимания слова лексикографический контекст не всегда достаточен. Толкования слов в двуязычном словаре являются сопоставительным контекстом наряду с примерами из национальных корпусов. Частые случаи раходящихся толкований в толковых словарях русского и болгарского языков могут создать впечатление об ошибочности:

победить - Нанести поражение противнику, выиграть бой, войну.

побеждавам - Спечелвам победа.


Очевидно, 'одержать победу' и 'нанести поражение' как интерпретации разнонаправленны, и в свою очередь могут потребовать толкования слов победа и поражение. Вариации в толкованиях являются необходимым и полезным набором лексикографических средств, который показывает многогранность значений слов, но в двуязычном словаре эти различия могут попросту сбить с толку читателя. Когнитивные комментарии к словам в этом случае более чем уместны. Так, словарная страница ПОБЕЖДАТЬ – ПОБЕЖДАВАМ включает более 20 слов, организованных в эквивалентные пары: надвивам, надделявам, надмогвам, печеля, оборвам, справям се, изигравам, преодолявам, побеждавам, овладявам и одолевать, превозмогать, справляться, побороть, пересилить, осилить, побеждать, одерживать и т.д. Очевидна необходимость ввести слова в некоторый более общий когнитивный контекст, что несомненно поможет любому читателю узнать больше о значении и употреблении слова.

Когнитивная схема. Поиск общих компонентов значений вышеперечисленных русских и болгарских глаголов позволяет выделить первый существенный признак - оценочное понятие "силы". Компонент "сила, усилие" может либо входить в эксплицитную структуру слова (р. насиловать, силиться, усилие, осилить, б. насилвам, пресилвам), либо же существовать как потенциальная величина (слова трудный, легкий, давление, тормозить, сдерживать, замучить, охватить). Вторым общим компонентом слов является представление кого-чего-л. как "иной силы" в ситуациях противостояния. Оценка объекта как иной силы способна поглотить любой материальный и идеальный объект, независимо от его свойств. Вот почему комары одолевают, болезнь покосила старика, туфли измучили меня, нужно оси
еще рефераты
Еще работы по разное