Лекция Автоматизация процесса перевода

К основным компонентам моб. совр. ИТ в перевод. бизнесе отн.:

· Информ.-справочная база (электр. словари, справочники, энциклопедии, нормативно-терминолог. Источники)

· Ср-ва накопления, поиска и восстановления фрагментиров. Переводов (сист. "памяти переводов")

· Ср-ва подготовки форматирования и конвертирования текст. данных, сист. локализации текстов перевода.

В наст. время большую роль приобретают ср-ва автоматизации повторного перевода с пом. специализ. переводческого инструментария. Появился целый класс сервисных программ под названием переводческие инструменты. В отличие от систем машинного перевода эти программные ср-ва не выполняют никаких переводч. операций, но они оказывают эфф. организационную поддержку переводческого процесса. Осущ. рутинные процессы, тем самым повышая производительность труда.

К таким прогр. средствам прежде всего относятся комп. программы, кот. называются Translation memory (ТМ-инструменты).

Они представляют собой систему, накапливающ. в Базе данных (БД) фрагменты исходных текстов и вар-ты их перевода.

Кроме ТМ-инструментов в наст. вр. широко распр. TMS инструменты (система терминологического обеспечения).

Разработаны т.н. программы локализации, т.е. программы для адаптации переводного текста к условиям англоязычной культуры. Trados, Dejavu, Sistran

Принцип действия ТМ инструм.

Эти программы интегрируются с обычными офисными. Они раб. с текстами созд. В прог-х Word, Exel, PP с другими текстами не работают. Нек. из них имеют собственные ср-ва редактирования текстов.

ТМ-и-т автоматич. вводит в БД предложен., подлеж. переводу. Обычно сегментирование текстов производится на базе точки затем автоматически к этому исходному предложению в БД дописывается выполненный пер-ом перевод. След. текст сегментируется и обрабатыв. таким же сп-бом и так же размещается в БД.

Общ. тенденц. в современ. переводч. бизнесе определяется как жанрово-тематическая специализация.

Большое значение для повыш. кач-ва и производительности перевод. бизнеса имеет оперативное терминологическое обеспечение.

Multiplex – оч. хороший электронный словарь.

Многие бюро переводов и индивид. Пер-ки сталкиваются с необходимостью создания собственного глоссария, т.е. узкоспециализированного словаря терминов и профессионализмов.

Большинство ТМ-инстр. обладают ф-ей технологического обеспечения. Они позволяют предварительно создавать глоссарий терминов.

Кроме того при обнаружении а переводном тексте слова или словосочетания кот. в прежних переводах было помечено как термин, ТМ инсрум.обращает внимание пер-ка на этот фрагмент переводимого текста, таким обр. реализуется важный параметр повышения кач-ва пер-да – принцип единства терминологии, который должен соблюдаться.

В условиях локальной комп. сети, принцип единства принятой терминологии будет соблюдаться всем составом пер-ов, работающих над этим текстом.

В наст. время уже сущ. Готовые терминологические БД, кот. могут быть подключены к ТМ инстр. в виде доп. Сменных или временных блоков.

По умолчанию ТМ инстр. настроен на 75% совпадения. Это означает, что при совпадении менее чем на 75% текст просматривается как новый и систем не дает подсказок.

 

 

Лекция 4

Машинный перевод

В отличие от ТМ-инструментов, которые лишь организационно помогают переводчикам, системы МП действительно порождают текст на языке перевода, а человек осущ-ет организацию работы комп-а и редактирование текста перевода.

Для достижения коммерчески оправданных результатов применение системы МП прежде всего необходимо обращаться к нему только тогда, когда это целесообразно.

На зачет* часто возникает необходимость принятия оперативного производственного решения по материалам большого текстового массива на ин. языке.

Современные системы МП работают примерно по такому же алгоритму, по которому в самых общих чертах работает и переводчик, но пер-к анализирует весь текст или его значительный фрагмент и анализирует и понимает широкий контекст, а отсутствие контекста порождает ошибки.

В технологии МП можно выделить критические аспекты, в которых вместе с тем существуют резервы повышения кач-ва МП. Прежде всего: если текст оригинала написан четким логичным стилем, если используются простые полные нераспространённые предложения, т.е. синтаксис текста перевода будет вполне удовлетворительным. В наше время большинство крупных фирм работают с учетом того, что их документация будет переводиться с помощью систем МП, т.е. док-ты готовят не разработчики и производители продукции, а квалифицированные лингвисты.

Просмотрев текст, направляемый на МП лингвист указывает приоритетный список словарей, которыми система должна пользоваться при переводе, при этом словари системы МП должны быть тщательно распределены по тематикам. В таких фирмах выработан свой собственный стиль с ограниченным кол-вом грамматических конструкций и словарем исключающим многозначность. При подготовке док-та важным критерием оценки языкового стиля док-та явл-ся оценка его переводимости именно той системой МП которой располагает данная фирма. На этом этапе учитываются возможные проблемы и предугадываются ошибки, которые могут быть устранены в процессе редактирования. Качество МП и рентабельность его систем значительно повышают 2 дополнительные технологические операции: предредактирование и постредактирование. Процесс предредактирования напоминает операцию перефразирования, кот. исп. пер-чик. Как правило крупные фирмы и предприятия издающие большие объемы сопроводительной док-ции заинтересованы в ее переводе сразу на несколько языков. Тщательная лингвистическая проработка и предредактирование исходного текста экономически целесообразны, поскольку позволяют повысить качество сразу нескольких переводов. Нельзя так же не учитывать тенденцию к формализации языка современной деловой коммуникации.

На современном этапе развития МП лидирующее положение занимают те системы, которые обеспечивают развитие лексических возможностей, располагают большим кол-вом подготовленных тематических словарей, обладают грамматическим обеспечением. Такие системы обеспечивают максимальное сохранение структуры и форматирования исходных док-ов и располагают возможностью одновременно использовать функции системы МП и ТМ-инструмента. Интеграция 2х функций в 1 технологии позволяет добиться синергетического (взаимодополняющее влияние систем – усилить преимущества, минимизировать недостатки) эффекта.

Итоги для зачета: в чем сходство и различие?

При МП машина переводит сама, при ТМ только записывает в базу данных. Сходство: позволяет автоматизировать процесс и что-то еще.

Почему соврем. Сис-ма МП можно максимально использовать? Потому что встроен ТМ.

 

Алгоритм работы МП.

Результаты перевода можно сохранять в БазеДанных и использовать в будущем, что значительно увеличивает скорость последующей работы. По мере пополнения БД повышается эффективность перевода, поскольку основная часть перевода подставляется из базы, а от пользователя требуется лишь корректировка тех фрагментов текста, которые были созданы с помощью автоматизированного перевода. Выделяются 4 основных этапа перевода док-тов.

1. Сегментация текста. Исходный текст разбивается на фрагменты в соответствии с заданными условиями. Самое типичное то, что заканчивается точкой либо точкой с запятой.

2. Перевод отдельных сегментов текста. По умолч. Любая сист. Настроена на 75% совпадений.

А. Выбор в базе данных. При обработке нового фрагмента текста система сравнивает его с хранящимися в Б ТМ-инструмента сегментами. При обнаружении идентичного или схожего сегмента его перевод отображается на экране с указанием совпадения в %. Сегменты, в которых % совпадения ниже указанного пользователем автоматически отправляются на МП.

Б. МП. Любой сегмент можно перевести в 2 случаях. 1. Если %совпадения между исходным сегментом и сегментом из базы меньше заданного. 2. Если перевод отсутствует в БД.

В. Ручной перевод. Пополнение базы переводов. Проверенные пользователем пары сегментов сохраняются в базе для дальнейшего использования.

Г. Результат перевода. Проверенные и отредактированные пользователем сегменты объединяются в текст перевода полным сохранением исходного форматирования.

 

Лекция 5

Получение текста на языке перевода еще не предполагает окончание полного технологического цикла. Одним из главных условий выполнения кач-го перевода явл. его функциональная равнозначность тексту оригинала. Переводчик обязан убедиться, что новый текст занимает в переводческой ситуации ту же позицию, что и оригинал: соблюдение условий языкового наполнения текста и формальные требования (объем текста, допустимый уровень экспрессивности, этическая адекватность и др.)

Для решения этих проблем сущ. Спец. Техническая операция: локализация текста перевода. Она позволяет учесть такие эл-ты как последовательность написания календарной даты, написание десятичных дробей, обеспечить совпадение объема текстов на разл. яз. и форматов предоставления текстов.