Инструменты автоматизированного перевода
Материал из Перевод 3000.
Андрей Косолапенко, команда программистов Advanced International Translations
Содержание |
Автоматизация перевода
Для определения автоматизированного перевода наиболее подходят слова Мартина Кея, постоянного председателя Международного Комитета по компьютерной лингвистике: «компьютер берет на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления».
Само собой понятно, что главную роль в автоматизации перевода играет программное обеспечение. Этот инструментарий является настолько многочисленным и многообразным, что его полного обзора хватило бы на несколько десятков подобных страниц, поэтому ограничимся беглым поверхностным обзором.
Типизация
Программные решения, имеющиеся на сегодняшний день на рынке варьируются от простых и узконаправленных приложений до больших программных пакетов, включающих в себя массу инструментов, как полезных, так и бесполезных. Так или иначе, все инструменты АП могут включать в себя следующие основные элементы:
- память переводов
- элайнмент
- управление терминологией
- проверка конкорданса
Память переводов
Программы управления автоматизированной памятью переводов (ТММ, Translation Memory Managers) — это, можно сказать «самые классические» инструменты АП, как правило неразрывные с инструментарием редактирования текста. Инструменты ТММ сохраняют в памяти перевод сегментов текста, выполненный переводчиком. Когда впоследствии переводчик встречает в тексте похожий сегмент, программа ТММ автоматически предлагает наиболее подходящий для него перевод из тех, что хранятся в памяти. В технических текстах, по определению встречается много похожих или даже одинаковых сегментов.
Элайнмент
Компьютер разбивает исходный текст и его перевод на сегменты, после чего определяет какой из сегментов исходного текста соответствует каждому из сегментов перевода. В результате программой создается база данных памяти переводов, которая в будущем может быть использована для перевода похожих текстов.
Терминология
Автоматический поиск терминов, встречающихся во время перевода текста по базе данных. Более сложные инструменты правления терминологией обеспечивают оперативное обновления базы данных терминов, поиск терминов в более чем одной базе (в том числе и удаленно), обмен терминами и их переводами внутри группы переводчиков работающих над одним проектом или одной узкой тематикой и совместный доступ к общим базам данных терминов.
Конкорданс
Согласно wikipedia, конкорданс (concordance) — это перечень основных слов, используемых в тексте с непосредственным контекстом этих слов. Программы конкорданса позволяют находить примеры слов или выражений в употребляемом контексте в одноязычном, двуязычном или многоязычном корпусе, как например, битекст или память переводов.
С некоторого времени к программам автоматизированного перевода стали причислять и программы управления крупными переводческими проектами.
Инструменты
- TRADOS Translator’s Workbench — наиболее широко испольуемый и наиболее крупный пакет программ, включающий в себя управления памятью переводов, терминологией, конкорданс, управление проектами. К сожалению, также намного более дорогой, чем конкуренты (в частности, обновления являются платными).
- DejaVu — базовый АП-инструментарий, включает основные функции. Из недостатков можно назвать не очень качественный поиск совпадений (fuzzy matches) сегментов, и отсутствие сетевой поддержки.
- STAR Transit — all-in-one текстовый редактор для переводчиков со встроенной памятью переводов, одновременный перевод сразу нескольких (!) файлов. Отдельное приложение управления терминологией (TermStar). С недавнего времени (версия ХV) включает конкорданс-модуль. Минусы — странная логика ведения базы данных (каждая запись — отдельный файл), неудобное отображение HTML и XML.
- Ambassador — программа глобального управления проектами переводов. Доступна общая память переводов, управление терминологией. Из минусов — веб интерфейс с которым приходится работать переводчику.
- WorldServer — глобальное программное решение, охватывающее как и Традос, практически все аспекты деятельности бюро переводов. Из средств автоматизации перевода присутствует память переводов (доступная для всех переводчиков), управление терминологией, конкорданс. Присутствует также функция машинного перевода.
- Appletrans — текстовый редактор с функцией памяти переводя для Маков.
- Across — целый пакет программ, в частности crossDesk (рабочая среда переводчика), crossTerm (управление терминологией), crossTank (память переводов) интегрированных между собой. Есть также stand-alone решение across Personal Edition.
- Heartsome Translation Suite — пакет из трех программ XLIFF Translation Editor (рабочая среда), TMX Editor (память переводов), Dictionary Editor (терминология). Каждую программу можно приобрести отдельно.
- MetaTexis — надстройка для MS Word, с функциями памяти перевода, управления терминологией и элайнмента (а-ля tag editor). Из преимуществ — умеренная цена, бесплатные апдейты. Из минусов — 100 % завязанность на MS Word (если у Вас Open Office — MetaTexis работать у Вас не будет).
- Wordfast — еще одна надстройка для MS Word со все тем же стандартным набором функций (память переводов, работа с терминологией). Единственное преимущество — либеральная система лицензирования: в тестовой версии ограничивается лишь максимальный объем памяти переводов, то есть фактически Wordfast можно совершенно бесплатно использовать для локализации небольших проектов.
- Cypresoft Trans Suite 2000 — продукт прекратил поступать в продажу
Ссылки
- wikipedia: Computer-assisted translation
- Machine Translation and Computer-Assisted Translation: a New Way of Translating? by Olivia Craciunescu, Constanza Gerding-Salas, Susan Stringer-O’Keeffe
- CAT-software (Computer Aided Translation) comparison by Filip Mourisso
- What You Need to Know About Translation Memories by Andres Heuberger
- Translation Memory eXchange (TMX) article on www.lisa.org
- Dr. Tom’s Independent Software Reviews by Dr. Thomas Wassmer
