Комп’ютерна лінгвістика як прикладна лінгвістична дисципліна.

Під терміном комп’ютерна лінгвістика (computational linguistics) звичайно розуміють широку ділянку використання комп’ютерних інструментів – програм, комп’ютерних технологій організації й оброблення даних – для моделювання функціювання мови в тих чи інших умовах, ситуаціях, проблемних ділянках, а також сферу застосування комп’ютерних моделей мови не лише в лінгвістиці, але й у суміжних дисциплінах. Лише в останньому випадку йдеться про прикладну лінгвістику у строгому смислі, оскільки комп’ютерне моделювання мови можна розглядати і як сферу використання (практичного застосування) теорії програмування (computer science) в ділянці лінгвістики.

Як особливий науковий напрямок комп’ютерна лінгвістика оформилась в 60-ті рр. ХХ ст.

 

На думку Б. Городецького, термін комп’ютерна лінгвістика задає загальну орієнтацію на використання комп’ютерів для розв’язання різноманітних наукових і практичних задач, пов’язаних з мовою, жодним чином не обмежуючи способи розв’язання задач.

 

У 1990 р. російський дослідник Ю. Городецький узагальнив три класи проблем комп'ютерного напрямку прикладної лінгвістики.

Перший об'єднує фундаментальні проблеми, пов'язані із представленням і моделюванням мовної системи, тезаурусів знань; із комп'ютерною репрезентацією граматики й рольової структури висловлень в автоматичних системах; із взаємодією вербаліки й невербаліки, мовних і фонових знань у комунікації; із метафоричним моделюванням і процесами розпізнавання повідомлень тощо.

Другий клас охоплює суто лінгвістичні проблеми штучного інтелекту:

розпізнавання й синтез мовлення, тексту;

розроблення метамов і мов репрезентації знань, лінгвістичних процесорів, здатних опрацьовувати тексти у стандартний спосіб для будь-якої системи перетворення мовної інформації; інтелектуальних інтерфейсів, баз даних, моделювання діалогу тощо.

До третього класу проблем Ю. Городецький відносить лінгвістичне забезпечення різних прикладних систем:

оброблення письмового тексту, автоматичного анотування (упорядкування стислих відомостей про документ),

індексування (перекладу на інформаційно-пошукову мову),

редагування (виправлення помилок) й реферування (стислого викладу змісту документа),

перекладу, аналізу запитів користувача природною мовою до інформаційної системи, інтелектуальних машинних словників, машинних фондів мовних одиниць, природномовного інтелектуального інтерфейсу,

а також моделювання дослідницької лінгвістичної діяльності, автоматизованих робочих місць лінгвіста і т. ін.

 

2. Когнітивний інструментарій комп’ютерної лінгвістики:

Комп’ютерна лінгвістика як особлива прикладна дисципліна виокремлюється насамперед за інструментом – тобто за використанням комп’ютерних засобів оброблення мовних даних. Оскільки комп’ютерні програми, які моделюють ті чи інші аспекти функціювання мови, можуть використовувати найрізноманітніші засоби програмування, то ніби про загальну метамову говорити не доводиться. Проте це не так. Існують загальні принципи комп’ютерного моделювання мислення, які в той чи інший спосіб реалізуються в будь-якій комп’ютерній програмі. В основі цієї мови лежить теорія знань, створена у штучному інтелекті і яка утворює важливий розділ когнітивної науки.

Основна теза теорії знань стверджує, що мислення – це процес оброблення та породження знань. Знання вважають неозначеною категорією. Як «процесор», який обробляє знання, виступає когнітивна система людини. В епістемології і когнітивній науці розрізняють два основних види знань – декларативні («знання що») і процедурні («знання як») (Ryle 1949).

Декларативні знання – це сукупність пропозицій, тверджень про що-небудь; інформація у довготривалій пам’яті про факти, події, предмети, ситуації тощо, яка може мати візуальний характер (у вигляді образів) і вербальний у вигляді пропозиційних структур.

Процедурні знання – автоматична й переважно неусвідомлена інформація в довготривалій пам’яті людини про певні дії й відповідні умови їхнього здійснення. Процедурні знання можуть бути вербалізованими у вигляді стійких навичок декларативної форми. Процедурні знання ураховують умови здійснення відповідних дій і автоматично вилучаються з пам’яті людини при усвідомленні нею мети діяльності й особливостей ситуації. Вони сприяють переведенню у робочу пам’ять декларативних знань і разом з ними забезпечують мовленнєву діяльність. Процедурну пам’ять вважають фільтром, за допомогою якого нові декларативні знання обробляються й надходять до декларативного складника пам’яті.

Пропозиція – (від лат. основне положення) – структура репрезентації знань про певну ситуацію (подію), що характеризується істинністю й несуперечливістю. Пропозиція є терміном логіки, який увів Б. Рассел.

 

Типовим прикладом декларативних знань можна вважати тлумачення слів у звичайних тлумачних словниках.

ЧАШКА (невелика посудина з фарфору, фаянсу тощо для пиття чаю, кави і т. ін.). Декларативні знання підлягають процедурі верифікації в термінах «істина – брехня».

Процедурні знання – це послідовність (список) операцій, дій, які належить виконати. Це деяка загальна інструкція про дії в певній ситуації. Характерний приклад процедурних знань – інструкції з користування побутовими приладами. Текст інструкції про налаштування сигналу відеомагнітофона…

На відміну від декларативних знань, процедурні знання неможливо верифікувати як істинні або хибні. Їх можна оцінювати тільки за успішністю-неуспішністю алгоритму.

Більшість понять когнітивного інструментарію комп’ютерної лінгвістики омонімічні: вони одночасно означають деякі реальні сутності когнітивної системи людини і способи представлення цих сутностей деякими метамовами. Іншими словами, елементи метамови мають онтологічний та інструментальний аспект.

 

Термін онтологія запропоновав Р. Гокленіус у 1613 р. у «Філософському словнику» («Lexicon philosophicum, quo tanquam clave philisophiae fores aperiunter. Fransofurti»), і трохи пізніше І. Клауберг в 1656 році у праці «Metaphysika de ente, quae rectus Ontosophia», який запропонував його (у варіанті «онтософія») як еквівалент поняття «метафізика». У практичному вживанні термін закріпив Х. Вольф, який явно роздів семантику термінів «онтологія» і «метафізика».

Онтологія – це опис багатьох об'єктів і зв'язків між ними. Формально онтологія складається з понять термінів, організованих у таксономію, їх описів і правил висновку.

Основне питання онтології: що існує?

Основні поняття онтології: буття, структура, властивості, форми буття (матеріальне, ідеальне, екзистенційне), простір, час, рух.

Сучасна філософія розглядає буття як єдину систему, всі частини якої взаємопов'язані і являють собою певну цілісність, єдність. Разом з тим світ розділений, дискретний і має чітку структуру. В основі структури світу 3 шари реальності: буття природи, буття соціальне, буття ідеальне.

 

Онтологічно розділення декларативних і процедурних знань відповідає різним типам знань когнітивної системи людини. Так, знання про конкретні предмети, об’єкти дійсності здебільшого декларативні, а функційні здатності людини ходити, бігати, керувати машиною реалізуються в когнітивній системі як процедурні знання.

Інструментально знання (як онтологічно процедурне, так і декларативне) можна уявити як сукупність дескрипцій, описів і як алгоритм, інструкцію. Іншими словами, онтологічно декларативне знання про об’єкт дійсності стіл можна процедурно представити як сукупність інструкцій, алгоритмів щодо його створення (= креативний аспект процедурного знання) чи як алгоритм його типового використання (=функційний аспект процедурного знання). У першому випадку це можуть бути вказівки для столяра-початківця, а в другому – опис можливостей офісного стола. І навпаки: онтологічне процедурне знання можна представити декларативно.

Досліджено, що декларативне знання більш експліцитне, воно легше усвідомлюється людиною, ніж процедурне. Процедурне знання – імпліцитне. Так, мовну здатність (яка є за своєю суттю процедурним знанням) людина не усвідомлює, вона прихована від людини. (Спроби експлікувати ці механізми призводять до дисфункції).

У теорії знань для вивчення і представлення знань використовують різні структури знань – фрейми, сценарії, плани. За визначенням Марвіна Мінського, фрейм – це структура даних, призначена для представлення стереотипної ситуації (Минский 1978, с. 254).

Фрейм – це концептуальна структура для декларативного представлення знань про типізовану тематично єдину ситуацію, яка містить слоти, пов’язані між собою певними семантичними відношеннями. Задля наочності фрейм часто подають у вигляді таблиці, рядки якої утворюють слоти. Кожний слот має своє ім’я та зміст.