Принцип работы современных CAT-программ

- Программа делит исходный текст на сегменты (как правило, это предложения или части предложений), и переводчик вписывает перевод каждого сегмента прямо под исходным текстом или – если текст представлен в виде таблицы – справа от него.

- Перевод сегмента сохраняется вместе с исходным текстом. Записываются также имя переводчика и дата перевода (что важно для командной работы). К сегменту можно вернуться в любой момент, чтобы проверить или изменить перевод.

- Программа помещает сегмент в память переводов, так что если он снова встретится в исходном тексте, его перевод подставится из ТМ автоматически. Кроме того, CAT-программа имеет функцию поиска нечетких соответствий: она обнаруживает сегменты, только частично схожие с уже переведенным (например, совпадающие на 75 %), и дает «подсказки» по их переводу.

 

Существует четыре основных типа сегментов:

- повторы (repetitions)

- частичные совпадения (fuzzy)

- 100%-е совпадения (100% matches)

- отсутствие совпадений (no matches)

 

No-matches – это сегменты, перевода которых нет в переводческой базе. Fuzzy – это сегменты, которые похожи на сегменты, переведенные в прошлом и сохраненные в базе. 100% matches – это переведенные и существующие в базе сегменты. Повторы же – это фрагменты, которые неоднократно встречаются в анализируемом тексте. Если в документе содержится пять одинаковых предложений, то в анализе появится один сегмент типа no-match и четыре повтора.

 

Повторы рассматриваются как 100% совпадения, так как перевод первого такого встреченного предложения (которое затем опять попадается в тексте) сохраняется в переводческой базе. В результате в следующий раз данное предложение переводится автоматически – с использованием перевода, сохраненного в базе.

 

В процессе перевода система проверяет, не был ли переведен и записан в переводческой базе такой же или похожий сегмент.

 

Если такой же либо похожий сегмент существует в переводческой базе, программа автоматически подскажет переводчику найденный перевод. Также она покажет, является ли сегмент в переводческой базе:

- идентичным (100% match)

- частичным совпадением (fuzzy match)

- с сегментом, который переводится в настоящий момент.

 

Многие CAT-программы позволяют подключать к процессу перевода терминологические базы для автоматического поиска и подстановки переводов глоссарных терминов (иногда для этого применяются дополнительные модули или приложения, например Multiterm для Trados).

 

Современные CAT-программы не только работают с памятью переводов и глоссариями, но и поддерживают модули проверки качества перевода, работу с метаданными (тегами разметки html и других форматов) и выполняют другие полезные функции.

 

Большинство CAT-программ позволяют проверять орфографию в переводе (либо встроенными средствами, либо подключая модуль проверки правописания Word). Для всех основных CAT-программ существуют модули сопоставления параллельных текстов, которые сегментируют их на фрагменты «оригинал-перевод», автоматически формируя на основе этих фрагментов память переводов.

 

В форматы, поддерживаемые CAT-программами, можно преобразовать файлы большинства популярных текстовых процессоров и приложений для верстки и публикации (файлы Office, RTF, HTML и др). Для удобства работы почти все CAT-программы позволяют группировать рабочие файлы, базы данных и глоссарии в отдельные проекты.