Разделы

Интернет Веб-сервисы

С родного на чужой и обратно: тестируем 7 онлайн-переводчиков

Выбор онлайн-переводчика – дело ответственное и неочевидное. Известно, что различные сервисы предоставляют неодинаковое качество перевода, более того – это качество у одного и того же сервиса разнится в зависимости от выбранной языковой пары. Как не ошибиться в выборе и получить наилучший результат для нужного языка? Ответить на этот вопрос поможет сравнительное тестирование, проведенное профессиональным переводчиком.

Онлайн-переводчики для сравнительного тестирования выбирались из списка наиболее известных сервисов на основе личных предпочтений автора. Приоритет был отдан тем, которые работают с русским языком и известны в России. Также были найдены онлайн-переводчики, для которых тот или иной язык (русский, немецкий, украинский, английский) является "родным", чтобы выяснить, насколько их уровень перевода на этот язык и обратно отличается от общепринятых мировых и российских лидеров.

Было рассмотрено 6 известных автору языков (русский, английский, немецкий, французский, украинский, польский), из них 4 синтетических, 2 аналитических, 3 славянских, 2 германских, 1 романский. Особое внимание уделялось сопоставлению уровня перевода между относительно близкими по строю языками (например, между славянскими или между западноевропейскими) с уровнем перевода между далекими по родству языками.

Обычно сервисы хорошо переводят с "родного" языка и обратно, при этом лучше всего работают с языковыми парами, в которых второй язык является близким "родному". Однако всегда есть место исключениям, как показывают оценки.

Оригиналы были взяты на всех шести языках из выборки по темам: новости науки, спорта и культуры, популярная психология, популярная лингвистика, здоровье, информационные технологии, авторские права в сети. Тексты были подобраны с минимумом сленга, узкоспециальной терминологии и запутанных грамматических конструкций – образцы литературного языка, доступного для понимания среднестатистическим пользователем, то есть средней сложности для переводчика. Все материалы были переведены в испытываемых сервисах на пять других языков из выборки, что составляет 30 направлений перевода.

Допустимая погрешность

В нашем исследовании достоверность результата зависит от добросовестности одного специалиста – автора статьи, причем польским и французским она владеет весьма несвободно. Также обзор мог бы стать более репрезентативным и выверенным за счет включения в выборку большего количества языков, представляющих разные языковые группы, и скрупулезного отбора текстов для тестирования.

Критерии выставления оценок (в баллах)

6 – "Работа специалиста" - ориентир, он же недостижимый идеал, на настоящий момент для всех технологий машинного перевода.
5 – "Готовый продукт" – перевод только с парой грамматических помарок и, возможно, не всегда самым-самым точным выбором лексики (встречается в некоторых сервисах при переводе между родственными языками).
4 – "Полуфабрикат" – ровный текст лишь с небольшими искажениями и редкими "темными местами", ясным общим смыслом, в целом хорошей лексикой и грамматикой, приятными находками в сложных случаях. Редко требуется обращение к оригиналу, но доработка специалистом необходима.
4,5 – "Полуфабрикат" плюс очень хорошая лексика и/или грамматика.
3,5 – "Полуфабрикат", но в тексте имеется повышенное содержание "темных мест", неправильных переводов слов, форм слов и связей между словами. N.B. (4,5 + 3,5)/2 = 4
3 – "Штамповка" – пословный перевод, более-менее понятный, но нередко с неточной лексикой, искаженным смыслом и грамматическими структурами, а также малым количеством адекватной фразеологии. Без оригинала смысл местами неясен.
2 – "Суррогат"– пословный перевод, часто с языка-посредника, смысл и грамматические связи еле угадываются, искажены.
1 – "Яд" – "Суррогат" плюс много непереведенных слов.

Оригиналы на разных языках получились неодинаковой сложности, точнее, в каждом тексте были свои сложности. Тем не менее, такие неоднородные материалы позволили оценить точность работы сервисов в целом, их сильные и слабые стороны. Вне зависимости от особенностей оригинала онлайн-переводчик вполне может показать свой уровень перевода, "технику" – будь то "механическая" подстановка словарных значений из скудного словарика или грамотная дешифровка и передача структуры предложения в сочетании с хорошими словарными базами и алгоритмами поиска, или даже (высший пилотаж) анализ контекста и в случае синонимии подбор оптимальных слов, фраз, грамматических форм.

Уровень работы с текстом вполне поддается оценке независимо от числа и многообразия сложных мест в исходных текстах. Кроме того, недостаточно развитое в сервисе направление перевода или просто плохой переводчик "напортачат" и в элементарном, тогда как качественные машинные переводчики справляются с большинством сложностей и выдают ровный, внятный текст (хоть он и уступает человеческому и полон неточностей).

По этим критериям (понятность и не "дословность") качество могут оценить и сами пользователи, вероятно, именно так и выбирают онлайн-помощников. Преимуществом данного обзора является лишь большее (по сравнению с реальными рабочими условиями) количество языков при единой базе "проверочных материалов".

Параметры оценки

Как выбрать корпоративный мессенджер, который защитит данные от утечек?
Цифровизация

Оцениваются адекватность выбора лексики, фразеологизмов, терминов, грамматических структур, связность и понятность перевода в сравнении с переводами того же текста на другие языки у того же сервиса и соответствующими показателями других приложений.

Список участников сравнения онлайн-переводчиков

Google Translate
PROMT
SDL FreeTranslation.com
Reverso
WordLingo
Bing Translator
Pragma

Далее онлайн-переводчики ранжированы не на основе результатов из таблицы, а по субъективно оцененному признаку "филигранности работы" с особенностями русского, английского и немецкого языков. Первые два наиболее актуальны для российского пользователя, а немецкий показателен при тестировании тем, что, как и русский, он весьма сложен в переводе, в том числе машинном, поэтому хорошее "владение" им придает приложению, так сказать, респектабельности.

При характеристике переводчиков также принималось во внимание (малое) число "халтурных" направлений перевода и дополнительная польза специалисту. К примеру, Google Translate "подсказывает" имена, термины, живые обороты речи, а онлайн-переводчики PROMT и SDL – грамматику.

Оценка онлайн-переводчиков в различных направлениях перевода* **

Увеличить

*Диапазон баллов: от 1 б. (бред) до 6 б. (работа специалиста).
Цветовые обозначения:
Сиреневый – очень хорошо
Серый – посредственно
Болотный – очень плохо
**Всего 30 направлений. Для просмотра полной версии нажмите на таблицу


Источник: данные автора, 2012 г.

Как противостоять обману в сети: новый выпуск видеоподкаста «CNews.Лица»
цифровизация

Сервисы из конца списка тоже предлагают хорошие переводы, но только в некоторых направлениях.

Google Translate: равный среди первых

Наиболее известный сервис – Google Translate – получает стабильно высокие баллы по многим рассмотренным направлениям перевода, а в парах с английским и в русско-украинском направлении максимально высокие.