Перевод как прикладная лингвистическая дисциплина 173


 


для многих сфер прикладной лингвистики — от лексикографии до лин­гвистического обеспечения информационно-поисковых систем и систем искусственного интеллекта. Стратегия «ограниченного машинного пере­вода» позволяет включать в технологическую цепочку автоматического перевода человека — на этапе предредактирования, постредактирования или в режиме обработки текста (например, для разрешения синонимии и омонимии).

1.4.3. Машинный перевод: элементы типологии систем. Компьютерные
средства перевода обычно разделяют на три больших группы: систе­
мы машинного перевода, системы человеко-машинного перевода (ЧМП)
и терминологические базы/банки данных (ТБД). Системы собственно
машинного перевода не исключают (даже, как правило, предполагают)
участие человека на этапе предредактирования и постредактирования.
В данном случае существенно, что после ввода текста в систему пере­
вод осуществляется без вмешательства человека. Используются только
алгоритмы и словари, введенные в ЭВМ.

Системы человеко-машинного перевода, в свою очередь, разделяются на две подгруппы: системы машинного перевода с участием человека и си­стемы человеческого перевода с участием машины. В первом случае ком­пьютерная программа сама осуществляет перевод, однако на определен­ных этапах она может обратиться к человеку, предложив ему, например, выбрать наиболее подходящее слово для перевода, дать синоним для неиз­вестного выражения или определить структуру сложной синтаксической конструкции. Наконец, человеческий перевод с участием машины все­гда осуществляется в режиме реального времени, причем основную часть работы по переводу берет на себя человек. Переводчик обращается к ком­пьютеру для автоматической обработки отдельных фрагментов текста, для вызова информации из терминологических банков данных (часто уда­ленных), для автоматического форматирования результирующего текста, проверки орфографии и пунктуации и т. д. Компьютерные системы такого рода иногда называют автоматизированным рабочим местом переводчика.

Терминологические банки данных удобны тем, что они легко мо­дифицируются и позволяют фиксировать самую последнюю словарную информацию по выбранной проблемной области. Часто они исполь­зуются для создания обычных двуязычных и многоязычных словарей, а также для разработки автоматизированных словарей систем МП. ТБД составляют важную часть рабочего места переводчика.

1.4.4. Основные области использования машинного перевода. Первоначаль­-ные иллюзии об универсальности применения МП быстро рассеялись.
Собственно, и спрос на машинный перевод художественных текстов
практически отсутствовал. Между тем область текстов научно-техниче-ской информации настолько велика, что человеческий перевод просто
не в состоянии ее охватить. В службах научно-технической информации
различных ведомств и организаций использование систем МП показало


высокую эффективность. Требования к качеству перевода оказались до­вольно низкими, что позволило использовать в этой сфере системы МП первого поколения. Вторая сфера применения МП — крупные меж­дународные организации, использующие документы на многих языках. К числу таких организаций относится, например, ООН и официальные структуры Европейского Союза, в которых документы должны появляться практически одновременно на всех языках членов ЕС. Однако требования к качеству перевода здесь довольно высоки и этап постредактирования необходим даже для систем МП с хорошими характеристиками.

Третья большая область использования МП — техническая докумен­тация. Экспорт продукции — особенно высокотехнологичной — требует перевода больших массивов технических описаний и инструкций. Так, эксплуатационная документация к самолетам достигает 100 и более тыс. страниц. Компании, связанные с экспортом, готовы даже нормиро­вать внутренний язык, используемый для технической документации, чтобы облегчить автоматический перевод этих документов на выход­ной язык. Например, в Европейской ассоциации авиапроизводителей (European Association of Aerospace Manufactures) под руководством Ван Дейка был разработан специальный стандарт АЕСМА «упрощенного ан­глийского языка», налагающий серьезные ограничения на используемую в документации лексику и синтаксические конструкции. Этот стандарт используется, в частности, в корпорации «Боинг» (см. по этому поводу [Wojcik 1997]).

В целом можно сделать вывод, что в настоящее время системы МП успешно функционируют в тех областях, где либо не требуется абсолютная точность перевода, либо существуют существенные огра­ничения на использование структур естественного языка, где входной язык нормирован и упрощен. К числу проблемных областей последнего типа относится, например, подъязык метеосводок. В Канаде с 1975 г. в промышленном режиме функционирует система МП TAUM-METEO, переводящая тексты метеосводок с английского языка на французский.

1.4.5. Некоторые известные системы машинного перевода. Количество ре­ально работающих и проектируемых систем МП к настоящему времени перевалило за сотню; в некоторых обзорах содержатся описания более, чем семидесяти систем МП [Леонтьева, Шаляпина 1990]. Остановимся на тех программах перевода, которые интересны с точки зрения введенных противопоставлений, характеризующих стратегии МП и типы систем МП.

Система GAT[14]. Одна из первых систем МП, разрабатывавшаяся с 1952 г. в Джорджтаунском университете США. Проблемная область — перевод русскоязычных текстов по физике на английский язык. Страте­гия создания — прямой перевод, сопровождавшийся некоторыми син­таксическими перестановками, приближавшими русский порядок слов