Системы автоматизации перевода

Автоматизация, под которой сегодня понимается применение машинной техники и технологии с целью облегчения человеческого труда, вытеснения его ручных форм и повышения его производительности (Современный экономический словарь 2007), активно внедряется в переводческую отрасль, позволяя переводчику сделать свой труд более сфокусированным, комплексным и творческим (Соловьева 2008:77).

К технологиям автоматизации относятся, прежде всего, технологии машинного перевода (machine / automatic / computer(-aided) translation).

Технологии машинного перевода берут свое начало с середины 40-х годов (см. работы У.Уивера и А.Д. Бута, например, Уивер У.Новая Башня // Машинный перевод.М.: 1957), их разработка тесно связана с развитием систем искусственного интеллекта. В 1954 году машинный перевод был впервые продемонстрирован на практике – уже упоминавшийся нами Джорджтаунский эксперимент. Однако вплоть до конца 50-х годов прошлого столетия ввода систем машинного перевода в промышленную эксплуатацию не осуществлялось даже на экспериментальном уровне. Опубликование отчета Наблюдательного комитета по автоматической обработке текстов Национальной академии наук США, в котором указывалось на экономическую невыгодность машинного перевода и бесперспективность научных исследований в этой области, усугубило пессимизм относительно этого рода проектов и приостановило разработку программ вплоть до конца 60-х годов. Уже в 70-е годы усиление роли информации на разных языках и необходимость оперативного перевода большого количества текстов в условиях научно-технической революции заставили специалистов разных профилей вновь обратить свое внимание на возможности машинного перевода (Семенов 2008, с. 5-8).

В процессе развития системы машинного перевода становятся более гибкими и рассматриваются в одном ряду с другими способами и средствами автоматизации перевода. Совершенствование технологичности систем идет по пути включения человека-переводчика в некоторые переходы между автоматическими процессами. Происходит естественное и удобное подчинение систем автоматического перевода качественным возможностям человека-переводчика (Семенов 2008: 9).

Сегодня, когда информационные потоки буквально захлестывают человечество, востребованность программ машинного перевода как никогда высока.

В основе программ лежит жесткий алгоритм, предполагающий синтаксический и семантический анализ переводимого предложения с последующим подыскиванием эквивалентов на языке перевода. Если текст оригинала написан четким и логичным стилем, а предложения – полные и небольшие по объему, это создает естественные условия для корректного синтаксического уподобления при переводе, и синтаксис переведенного текста будет вполне удовлетворительным. Для решения семантических задач привлекается жесткое распределение по тематикам словарей, к которым обращается программа. При указании приоритетного списка словарей, при постоянном расширении и редакции их словников, программа машинного перевода становится менее зависима от разнообразия и разнородности языковых ресурсов и способна осуществлять более точный выбор соответствия (Семенов 2008: 41).

Качество машинного перевода и рентабельность его систем значительно повышают две дополнительные технологические операции: предредактирование и постредактирование.

Кроме того, нельзя не учитывать тенденцию к формализации языка оперативной коммуникации, проявляющуюся в использовании речевых штампов, аббревиатур, типового ядерного синтаксиса. Все это расширяет сферу применения систем машинного перевода.

Наиболее хорошо известными программами машинного перевода являются системы PROMT, SYSTRAN, а также «он-лайновые переводчики» популярных поисковых систем, например, Google Переводчик и др.

Принципиально иной технологией автоматизации переводческого процесса является технология накопительного перевода (translationmemory). Эта технология положена в основу программ, известных как CAT-системы, системы класса «Память переводов» или TM-инструменты (Computer/AidedTranslationSystems / Tools).

ТМ-инструменты – это класс программ, предназначенных для накопления, структурирования и хранения в определенном порядке результатов переводческой деятельности, оказывающих активную и эффективную организационную поддержку переводческого процесса, создающих комфортную среду и повышающих производительность труда за счет осуществления рутинных переводческих операций (Перевод: информационные технологии 2009).

Основная идея концепции системы автоматизации перевода – исключение необходимости снова переводить стереотипные (повторяющиеся) фрагменты текста.

Практическое назначение ТМ-инструментов можно обозначить следующим образом:

• Перевод документации с высокой степенью повторяемости текстов (технической, финансовой, юридической и др.)

• Локализация программного обеспечения

• Ведение терминологических глоссариев

• Проверка качества перевода

• Создание и распределение переводческих проектов

• Встраивание в системы документооборота и др.

Главный элемент переводческих инструментов – это создаваемая самим переводчиком база билингв – пары сопоставленных друг с другом сегментов (translationunits – TU) на исходном и переводящем языках. Единица перевода обычно равна предложению, но может быть изменена (фраза, абзац) на усмотрение переводчика (Перевод: информационные технологии 2009).

Одновременно с базой билингв, аккумулирующей исходные предложения и их переводы (SentenceMemory), переводческие инструменты располагают системами терминологического обеспечения (termbases) - программными средствами, осуществляющими автоматический просмотр исходного текста и предлагающими варианты перевода терминов, которые были приняты переводчиком в ранее выполненных и сохраненных в памяти переводах (Перевод: информационные технологии 2009).

Системы терминологического обеспечения создаются в виде одно-, дву- и многоязычных глоссариев. Словарные статьи имеют разветвленную структуру и содержат обширную информацию, необходимую для принятия решения об использовании того или иного термина: термин, аббревиатура, синонимы, определение, контекст, источник, статус, комментарий, рисунки, звукозаписи, перекрестные ссылки и т.д.

Пакет системы, как правило, включает дополнительные сервисные программы, позволяющие более эффективно организовывать работу по формированию базы билингв, а также непосредственно по переводу текстов, позволяя осуществлять поиск по нескольким базам памяти перевода, проверку качества оформления и орфографии, контроль ошибок непосредственно при вводе текста, предварительный просмотр в режиме реального времени и т.д.

Широко известными сегодня являются такие ТМ-инструменты, как Trados (5 Freelance, Studio 2009), DejaVu (DejaVuX), StarTransit (TransitXV), Catalyst (4.0), Wordfast и др. Некоторые из них (Trados, DejaVu, StarTransit) – это дорогие и мощные инструменты, часто промышленного масштаба (используются в переводческих бюро, агентствах, отделах крупных организаций), предназначенные для автоматизации всего процесса перевода: от менеджмента проекта до предоставления результатов перевода заказчику. Существуют и более дешевые виды программ, доступные и переводчикам-фрилансерам: программа Wordfast, Pi-Consult – Across и др.

Итак, в наше время переводческая отрасль развивается впечатляющими темпами. Применение новейших технологий в области лексикографической поддержки переводческих процессов становится важнейшим фактором конкурентноспособности на рынке переводческих услуг. Именно использование современной и качественной электронной лексикографической продукции способствует росту производительности труда переводчиков, расширению спектра оказываемых услуг, повышения качества перевода.