Принципи класифiкацiї систем машинного перекладу

ВСТУП

Характерними тенденціями розвитку сучасного суспільства є посилення процесів глобалізації та інформатизації, що призводять до збільшення й спрощення інтернаціональних зв’язків і контактів. Розширення глобальної мережі Інтернетнадає всі умови для інтернаціонального спілкування – від традиційного листування до голосової та відеокомунікації. Єдиною перешкодою на цьому шляху залишається мовний бар’єр, подолання якого за допомогою традиційного перекладу не розв’язує проблеми повністю, оскільки обсяг перекладів у світі постійно зростає, і навіть збільшення кількості перекладачівне в змозі повністю задовольнити потреби в перекладах. Тотальна комп’ютеризація всього світу та гонитва за новими потужностями серед розробників, удосконалення й вихід нових версій програмних продуктів, спроби зробити програмне забезпечення максимально сумісним із низкою інших приладів та програм, інші ноу-хау індустрії та технічного прогресу майже щодня виводять на ринок нові вироби, які мають бути описані й перекладені якомога більшою кількістю мов для донесення до кінцевого користувача і збільшення обсягів продажу.

Однією з можливостей подолання мовного бар’єру у спілкуванні є застосування систем машинного перекладу (СМП) як засобу підвищення продуктивності перекладацької праці. Але машинні перекладачіможуть бути лише підмогою в роботі фахівців різних профілів, і не можуть замінити людей-перекладачів. У першу чергу це пов'язано з тим, що в більшості випадків машинний перекладач не може зробити повністю адекватний переклад з однієї мови на іншу, й машинний переклад тексту дуже сильно поступається перекладу людиною, потребуючи подальшої доробки. Дана робота має на меті вивчення зазначених проблем, а також аналіз деяких лінгвістичних програмних продуктів, спрямованих на автоматизацію процесу перекладу.

Дослідження спирається на праці з машинного перекладу (Анисимов В., Блехман М.С., Войнов В.К., Марчук Ю.Н., Шаляпина З.М.) та роботи з теорії перекладу (Комиссаров В.Н., Корунец И.В., Швейцер А.Д.).

Малюнок1


Роль машинного перекладу в сучасному світі

Принципи класифiкацiї систем машинного перекладу

В основі iнженерно-лiнгвiстичного підходу до проблематики машинного перекладу має лежати лiнгвiстичнакласифiкацiя систем МП. Перш ніж запропонувати типологію систем, визначимо можливі різноманітні підвалини такої класифiкацiї. Це пояснюється багатоаспектнiстю самої проблематики.

Із літератури нам відомірізні принципи класифiкацiї. Щодо участі ЕОМ у процесі перекладу, обсягу роботи, яку вона “бере на себе”, системи МП поділяються на автоматизовані та автоматичні. Першим в англiйськiй мові вiдповiдає термін MAT (machine-aidedtranslation), тобто переклад, який виконується за допомогою машини, а другим –MT (machinetranslation), тобто машинний переклад.

В автоматизованих системах МП людина є обов’язковим учасником процесу перекладу. На частку машини в них приходиться виконання тільки рутинних операцій – пошук слів i словосполучень в автоматичному словнику та виведення їхнього перекладу на екран з можливою наступною вставкою у вихідний текст.[3]

Навпаки, в автоматичних системах машина здійснює аналіз вхідного тексту та синтез вихідного, і переклад, хоча й має неминучі лексичні, граматичні, стилiстичнi помилки, в цілому є зрозумілим користувачеві й може бути використаний у вигляді iнформацiйного документу, котрий в деякій мiрi може замінити оригінал. У той же час, такі системи, як правило, мають засоби редагування машинного продукту, що особливо важливо при перекладі текстів, котрі мають статут документів у прямому значенні цього слова, наприклад, технічної документації, котра поставляється за кордон разом з устаткуванням, що експортується.[22]

Ще однією характеристикою системи МП є кiлькiсть мов, що їх “розуміє” система. Вiдповiдно до даного критерію будемо розрізняти двомовні та багатомовні системи. Перші здійснюють переклад для однієї мовної пари. Якщо ж система охоплює більше однієї мовної пари, вона є багатомовною.

У розвиток цього пункту доцільно ввести також такий пiдроздiл систем МП, як оборотність (англійський термін - “two-waysystems”) i необоротність (“1-way systems”). Системи першого типу перекладають текст тільки “в один бік”, а системи другого типу – “в обидві сторони”.[28]

Важливою характеристикою систем МП є також тип документів, на переклад яких орієнтована система. Зокрема, існують системи, якi працюють тільки з заголовками документів (наприклад, патентів); iншi– здебільшого з технічними специфiкацiями, тощо. Існують також унiверсальнi системи, якi можуть на однаковому рiвнi ефективності перекладати тексти рiзноманiтних типів (try-anythingsystems– термін Вероніки Лоусон).[4]

Промислові системи МП розрізняються в залежності від тематичних галузей. Визначимо при цьому, що в сучасних системах МП програмне забезпечення залежить тільки від структури лiнгвiстичного забезпечення, але не вiд конкретного наповнення автоматичного словника, i треба розрізняти саме словники систем, а також практичну можливість їхнього поширення.

У залежності від підходу, на основі якого виконується машинний переклад, СМП поділяються на: статистичні (statistic) та традиційні – системи, які ґрунтуються на використанні лінгвістичних правил (rule-based).

Суто лінгвістичний принцип класифікації,[5] згідно з яким СМП базуються на використанні лінгвістичних правил, іподіляються на:

¾ системи, що реалізують прямий переклад (directtranslation);

¾ системи, які базуються на трансфері (transferapproach);

¾ системи з мовою-посередником (interlinguaapproach).

Оскільки два останніх критерії класифiкацiї представляють особливий інтерес для нас у даній роботі, розглянемо їх детальніше.