Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online

Компьютерная лексикография в настоящее время уверенно становится приори­тетным направлением, «задвигая» классическую, «бумажную» лексикографию на вто­рой план. Это и не удивительно, учитывая, насколько прочно вошли в нашу жизнь ин­формационные технологии. При этом, компьютерная лексикография является не про­сто механической заменой классической лексикографии, а новой ступенью её развития, вводя в обиход совершенно новые понятия, методы и приёмы организации словника. Эта мысль, конечно, тривиальна, но тем более удивительно, что доводится нередко слышать суждения, свидетельствующие о полном непонимании этого. Хотя, вероятно, удивляться здесь нечему, поскольку компьютерная лексикография, как и многие подоб­ные ей инновационные отрасли науки, находятся в самом начале своего развития (при­чём развития весьма бурного), производя своеобразную революцию в лингвистике и способствуя образованию новой совершенно парадигмы, которая ещё окончательно не сформирована и, следовательно, до конца не осознаётся. Электронные словари часто воспринимаются сквозь призму обычных, бумажных, «по старым правилам». Ключевой момент здесь заключается в том, что старые правила не применимы к новой ситуации в полной мере, эти правила тоже подлежат пересмотру, модернизации. Образно говоря, уравнивать электронный словарь с бумажным - это то же самое, что уравнивать печат­ную машинку с текстовым редактором Microsoft Word. Их можно рассматривать и срав­нивать только в диахронном аспекте, но ни в коем случае не в синхронном.

Из всего вышесказанного можно сделать закономерный вывод, что поскольку компьютерная лексикография является совершенно новой областью прикладной линг­вистики, то и нерешённых проблем здесь огромное множество. В числе первых можно отметить проблему классификации электронных словарей, проблему достоверности, содержащейся в них информации, проблему принципов построения как всего словаря в целом, так и отдельных словарных статей, и это только верхушка айсберга. В таких условиях необходимо вырабатывать принципиально новый подход к новым феноме­нам, изменять, трансформировать имеющиеся критерии, принципы и правила.

В настоящий момент этот процесс уже начинается, хотя, как уже отмечалось, он осложнён многими особенностями периода «перехода» от классической лексико­графии к электронной. Тем не менее во многих работах, в особенности в статьях за­рубежных коллег, уже намечается этот «принципиально новый подход», который, вероятно, и определит будущую лексикографическую парадигму.

Отличия этого подхода заключаются как во введении новых понятий, терми­нов, характеризующих новые феномены, так и в освоении новых приёмов, принци­пов организации и функционирования электронных словарей. В качестве примеров можно привести понятия гипертекста и гипертекстовой разметки словаря, а также принцип самоадаптации словаря к нуждам конкретного пользователя, которые по­дробно описывает Дени Арнос Куори в своей работе «Adaptive Hypermedia and User- Oriented Data for Online Dictionaries» [1].

Вместе с тем необходимо изучать уже имеющиеся электронные словари, при­чём не только для их улучшения (что является, несомненно, основной целью такого исследования), но и для формирования теоретической базы в сфере компьютерной лексикографии. Основой для подобного рода анализа служат классическая лексико­графическая теория, модернизированная и приспособленная к новым явлениям лек­сикографической практики. В данной работе осуществляется анализ онлайн- словарей Мультитран и ABBYY Lingvo Online.

Оба упомянутых словаря являются крупнейшими русскоязычными ресурсами, и в некотором роде конкурентами, к тому же они являются частью коммерческих проектов и имеют свои платные версии.

Для сопоставления выбранных онлайн-словарей используется метод парамет­рического анализа, предложенный Ю. Н. Карауловым в его работе «Лингвистическое конструирование и тезаурус литературного языка» [2, с. 74-108]. Необходимо отметить, что схема и набор параметров для анализа в работе Ю. Н. Караулова предназначались для исследования идеографических словарей, поэтому в данной работе набор пара­метров был изменен на более подходящий для анализа онлайн-словарей.

Таким образом, были отобраны следующие параметры.

  1. Объём словника. Здесь необходимо уточнить, что объём словника в случае с электронным словарём (и в том числе онлайн-словарём) является неоднозначным по­казателем, в отличие от традиционных бумажных словарей, по нескольким причинам: во-первых, подавляющее большинство двуязычных электронных словарей имеют сразу два направления перевода, например, англо-русский и русско-английский, а некоторые электронные словари к тому же многоязычные, что даёт ещё большее количество ва­риантов. Во-вторых, многие электронные словари имеют в своём составе дополнитель­ный терминологический тезаурус, что резко увеличивает объём словника. Например, электронный словарь ABBYY Lingvo x5 «20 языков» включает в себя в общей сложно­сти около 18,3 миллиона словарных статей. Такой объемный электронный словарь бо­лее корректно сравнивать не с одним, а с целым набором бумажных словарей. Кроме того, нельзя забывать, что многие онлайн-словари являются «открытыми», то есть они могут пополняться как создателями данного словаря, так и авторизованными пользова­телями. Таким образом, словник онлайн-словарей постоянно увеличивается, что созда­ёт дополнительные сложности для его оценки.
  2. Количество языковых пар. Оба рассматриваемых словаря служат преимуще­ственно для перевода слов и словосочетаний с иностранного языка на русский, или об­ратно, однако они имеют и другие направления. В большей мере это развито в ABBYY Lingvo Online, где предоставляется возможность выбора обеих языков из выпадающих списков. В Мультитране имеется только две языковые пары, не включающие в себя рус­ский язык: англо-немецкий и англо-эстонский словари. Впрочем, кажущаяся, на первый взгляд, свобода выбора языков в ABBYY Lingvo Online на деле весьма ограничена: дале­ко не для всех доступных языковых пар имеются словари, например, можно выбрать для работы испанский и татарский языки, но словари для такого направления отсутствуют. В данном словаре языковые пары так же, как и в Мультитране, строятся преимущественно между русским и одним из иностранных языков. Имеется также несколько языковых пар английского и некоторых других иностранных языков, но в целом направления перевода с одного иностранного языка на другой весьма ограничены. Здесь необходимо отметить, что англо-русское (и соответственно русско-английское) направление является приори­тетным как в Мультитране, так и в ABBYY Lingvo Online. Несмотря на многоязычность данных словарей, почти половина словника в Мультитране и приблизительно треть словника в ABBYY Lingvo Online приходится на английские и русские словари.
  3. Наличие и количество специализированных словарей. В принципе, такие сло­вари присутствуют в виде дополнений практически в любом крупном электронном словаре, и данные онлайн-словари не являются исключением. Здесь несколько раз­нится только способ представления статей специализированных словарей при выводе результатов запроса: в ABBYY Lingvo Online они представлены в виде набора отдель­ных карточек, каждая из которых имеет собственную структуру, пронумерованные ва­рианты значений и словосочетания, тогда как в Мультитране та же самая информация представлена в виде одной большой статьи, где данные тематических словарей пере­числяются в разных строках, обозначенных соответствующими пометами, а словосо­четания приведены в самом конце такой статьи. Это несколько затрудняет оценку, по­скольку многие из таких «тематических словарей» включают в себя буквально 2-3 слова, поэтому при анализе учитывались словари, состоящие, как минимум, из 100 словарных статей. Впрочем, и таких словарей в Мультитране насчитывается прибли­зительно 2500 по причине значительного тематического дробления словника. Напри­мер, если в состав ABBYY Lingvo Online входит словарь медицинской терминологии, то в Мультитране ему соответствуют тематические словари по хирургии, офтальмоло­гии, ортопедии и т.п. Таким образом, ABBYY Lingvo Online располагает гораздо мень­шим количеством специальных словарей, однако каждый из них весьма значительно­го объёма, в то время как Мультитран состоит из большого количества узкоспециали­зированных тематических словарей, содержащих весьма небольшой объём лексики.
  4. Наличие и характер гиперссылок. Некоторые электронные словари, являющи­еся простым аналогом бумажных словарей, но реализованным в электронном виде не имеют гиперссылок в словарных статьях, однако в настоящий момент такое встреча­ется уже довольно редко. Подобная практика существовала на раннем этапе развития электронных словарей, однако сейчас ни один электронный словарь уже не обходится без гипертекста. Разница преимущественно заключается в том, насколько этот гипер­текст развит и для каких целей используется. Чаще всего гиперссылки используются для перехода от одного слова из данной словарной статьи к статье, где это слово бу­дет заглавным. Такой подход используется, например, в словаре Мультитран, где ги­перссылки ведут к переводу данного слова, то есть открывают словарную статью на другом языке. В словаре ABBYY Lingvo Online гиперссылки имеют другую функцию: они помогают выводить список примеров употребления данного слова.
  5. Наличие мультимедийной информации в словарных статьях. Возможности электронных словарей позволяют приводить иллюстративный материал в абсолют­но новой форме, по сравнению с классическими бумажными словарями. В словар­ных статьях может быть использована мультимедийная информация, то есть аудио- и видеофайлы. В онлайн-словарях используется аудиоинформация для представле­ния произношения слов. В исследуемых словарях такая функция имеется только у ABBYY Lingvo Online, с помощью которого пользователь может прослушать произ­ношения 76000 слов и словосочетаний в словарях английского, немецкого, француз­ского, итальянского, испанского, китайского и украинского языков.
  6. Наличие примеров употребления слов. Многие современные электронные сло­вари предоставляют пользователю примеры употребления запрашиваемых слов, что позволяет наиболее полно представить смысловое содержание слова. В случае с он­лайн-словарями это представляет особую ценность, поскольку базы примеров постоянно пополняются. В рассматриваемых словарях данная функция реализована по-разному. В словаре Мультитран примеры даются в самом конце общей словарной статьи, причём они рассортированы по тематикам. В словаре ABBYY Lingvo Online примеры употребле­ния слов доступны через гиперссылки при щелчке мышью на требуемое слово.
  7. Возможность расширения словаря пользователями. Данная функция является весьма ценной и представляет собой настоящий прорыв в лексикографии. Словарь, по­стоянно пополняемый достаточно большим количеством людей, среди которых не только лингвисты, но и специалисты в других областях знания, несомненно, будет го­раздо более полно отвечать запросам пользователей. Впрочем, здесь есть и опреде­лённые недостатки. Во-первых, информация, добавляемая людьми «со стороны», не являющимися профессиональными лексикографами, может быть не точной или вооб­ще не верной. Здесь, безусловно, необходим строгий контроль со стороны составите­лей данного словаря. Во-вторых, информация, вносимая разными пользователями, подчас не унифицирована и нередко вносит чрезмерное многообразие. Пользователю предоставляется множество сходных вариантов перевода какого-либо слова без всяко­го пояснения, что крайне затрудняет выбор наиболее подходящего эквивалента.
  8. Наличие интеллектуального ввода и проверки орфографии. Данная функция появилась в онлайн-словарях относительно недавно, но в настоящий момент она явля­ется весьма востребованной, поскольку значительно облегчает работу пользователя со словарём. На данном этапе эти функции во многих онлайн-словарях всё ещё далеки от идеала. Такая проблема существует не только в отечественной компьютерной лексико­графии, но и в зарубежной, где внедрение систем интеллектуального ввода в онлайн- словари началось раньше, о чём пишут в своей работе «Online English Learners’ Diction­aries and Misspellings: One Year On» Роберт Лью и Роджер Миттон [3]. Интеллектуаль­ный ввод, то есть подстановка вариантов слова при его наборе является весьма мощ­ным инструментом, упрощающим работу пользователя со словарём и ускоряющим процесс перевода. Сопряжение данной функции с подбором возможных вариантов при орфографической ошибке в наборе слова также весьма важно, поскольку пользователь далеко не всегда уверен в том, как пишется то или иное слово на чужом для него языке. В исследуемых онлайн-словарях такое сопряжение полностью реализовано только в Мультитране, поскольку в ABBYY Lingvo Online отсутствует интеллектуальный ввод текста, и это весьма удивительно, учитывая, что в компьютерных словарях ABBYY Lingvo такая функция присутствует с самых ранних версий.

В соответствии с вышеперечисленными параметрами была построена матрица параметрического анализа словарей Мультитран и ABBYY Lingvo Online, наглядно представленная в табл. 1. К сожалению, как уже указывалось при подробном описании параметров, некоторые данные могут быть представлены только приблизительно. При­чиной этого является прежде всего тот факт, что онлайн-словарь - это открытая систе­ма с огромным количеством элементов, находящаяся в постоянном развитии. Кроме этого, при создании разных онлайн-словарей применяются довольно разнящиеся ме­тодики, что ведёт к сложностям в сопоставлении сходных элементов. Примером этого могут служить тематические словари в каждом из рассматриваемых онлайн-словарей.

Результаты параметрического анализа онлайн-словарей Мультитран и ABBYY Lingvo Online

Результаты параметрического анализа онлайн-словарей Мультитран и ABBYY Lingvo Online
  Словари
Параметр Мультитран ABBYY Lingvo Online
1. Объём словника Приблизительно 12 млн. слов Приблизительно 18 млн. слов
2. Количество языковых пар 13 языковых пар Рабочие языки: русский, англий­ский, немецкий, французский, ис­панский, итальянский, нидерланд­ский, латышский, эстонский, афри­каанс, эсперанто, калмыцкий 28 языковых пар Рабочие языки: английский, венгер­ский, греческий, датский, испанский, итальянский,казахский, китайский, латинский, немецкий, нидерланд­ский, норвежский, польский, порту­гальский, русский, татарский, ту­рецкий, украинский, французский, финский
3. Наличие и количествоспециализированных словарей Приблизительно 2500 словарей 217 словарей
4. Наличие и характер гиперссылок Гиперссылки используются для пе­рехода между словарными статья­ми противоположного направления перевода Гиперссылки используются для пе­рехода к примерам словоупотреб­ления
5. Наличие мультиме­дийной информации в словарных статьях - Часть заглавных слов озвучена
6. Наличие примеров употребления слов Даны в словарной статье отдель­ным блоком с тематическим разби­ением Выдаются во всплывающем окне при нажатии на гиперссылку
7. Возможность расши­рения словаря пользова­телями + +
8. Наличие интеллекту­ального ввода и провер­ки орфографии. Имеется интеллектуальный ввод и подбор вариантов при орфографи­ческой ошибке Отсутствует интеллектуальный ввод, имеется подбор вариантов при орфографической ошибке

Из результатов сравнительного анализа видно, что ABBYY Lingvo Online об­ладает более солидной словарной базой и превосходит Мультитран по количеству рабочих языков и языковых пар. Другими преимуществами данного словаря являют­ся наличие озвученных заглавных слов в некоторых словарных статьях, более про­стой доступ к примерам словоупотребления для конкретного слова. Учитывая также тот факт, что результаты перевода слова раскладываются в виде набора словарных статей из нескольких словарей, в виде, весьма напоминающем классический бумаж­ный словарь, можно предположить, что данный словарь рассчитан на самый широ­кий круг пользователей и может быть успешно использован как для профессиональ­ного перевода иноязычных текстов, так и при обучении иностранному языку, чтении и написании иноязычных текстов.

Словарь Мультитран располагает интеллектуальным вводом текста, имеет более детальное тематическое членение словника, обеспечивает более быстрый переход между рабочими языками и при таких характеристиках удобен в большей мере для профессионального перевода текстов различной тематики.

Ссылки на источники

  1. Kwary D. A. Adaptive Hypermedia and User-Oriented Data for Online Dictionaries: A Case Study on an English Dictionary of Finance for Indonesian Students // International Journal of Lexicography. - 2012. - Vol. 25. - Issue 1 (March). - URL: http://ijl.oxfordjournals.org/content/25/1/30.full. - [Дата обращения 26.10.2013].
  2. Караулов Ю. Н. Лингвистическое конструирование и тезаурус литературного языка. - М.: Наука, 1981. - 368 с.
  3. Lew R., Mitton R. Online English Learners’ Dictionaries and Misspellings: One Year On // International Journal of Lexicography. -                  2013.   - Vol. 26.            - Issue 2 (June). - URL: http://ijl.oxfordjournals.org/content/26/2/219.full. - [Дата обращения 28.10.2013].
Автор
Марус Максим Леонидович
УДК
81-13
Summary
This article deals with the main characteristics of Multitran and ABBYY Lingvo Online multilingual online dictionaries, comparative analysis of the said dictionaries is undertaken, and the conclusions concerning their applicability are drawn.
Аннотация
В статье рассматриваются основные параметры многоязычных он­лайн-словарей Мультитран и ABBYY Lingvo Online, а также производится их срав­нительный анализ, на основе которого формулируются выводы об их области применения.
Категория
Ключевые слова
компьютерная лексикография, электронный словарь, онлайн- словарь.
Название на английском
Comparative analysis of modern multilingual online dictionaries, evidence from Multitran and ABBYY Lingvo Online dictionaries
Организация
ФГБОУ ВПО «Омский государственный аграрный университет им. П. А. Столыпина», г. Омск.
Статус автора
Доктор философии