III. Прикладная лингвистика

К сфере прикладного языкознания относятся компьютерная лингвистика, прикладное терминоведение, автоматический перевод, лингвистическая информатика.

Компьютерная лингвистика.

В XX в. возникла необходимость создать языки человеко-машинного общения. Для этого было необходимо собственно лингвистические проблемы решать в единстве с другими науками — логикой, математикой, психологией и кибернетикой. Цель такого симбиоза наук - создание автоматических систем искусственного интеллекта, моделирующих знание. Знание хранится, обрабатывается и передается от поколения к поколению в языке и текстах. Поэтому моделирование научно-технических текстов — это моделирование системы знаний в соответствующей отрасли науки и техники.

Любая терминосистема связана с соответствующей системой знаний. Она всегда стремится найти свой оптимальный план выражения. Формой любого понятия являются знаки естественного языка. Следовательно, моделирование знаний - это структурирование соответствующей терминосистемы.

Система знаний представляется в виде сети: узлы такой сети представлены терминами соответствующей науки, а дуги между ними показывают отношения между понятиями. Однако передать логико-понятийные знания, обосновать и интерпретировать их при помощи одних терминосистем невозможно. Для достижения этой цели служит научный текст, где терминосистемы органически взаимодействуют с морфологической и синтаксической подсистемами естественного языка (значениями морфем, частей речи, служебных слов и словосочетаний). Любая логико-понятийная система знаний может быть представлена в виде текста.

Главной задачей прикладных лингвистических наук, связанных с анализом текста, является создание текстовой базы данных для ЭВМ. Такая база данных напоминает автоматизированные библиотечные фонды. Текстовая база данных, хранящаяся в памяти ЭВМ, позволяет многократно использовать тот или иной текст, получая каждый раз нужную информацию:

1) полный список всех словоформ соответствующего текста;

2) элементы морфологической подсистемы текста;

3) частоту встречаемости каждой словоформы и всех словоформ (суммарно)
данного текста или всех текстов, введенных в ЭВМ;

4) адреса словоформ (номера глав, параграфов, страниц);

5) статистику графических знаков (букв, буквосочетаний);

6) контексты каждой словоформы;

7) обратный словарь;

8) текст в полном виде.

Использование ЭВМ в прикладных отраслях языкознания основано на возможности кодирования любой информации при помощи чисел, которые можно обрабатывать посредством ЭВМ. Почву для использования ЭВМ в лингвистике подготовило опережающее развитие математической логики и теории алгоритмов: создание машины Поста, машины Тьюринга, алгоритмов Маркова. С появлением этих машин стала возможной обработка нечисловой информации. Машины были «обучены» мыслить по образцу человеческого интеллекта. В результате создается искусственный интеллект. Первый опыт в этой области описан в статье А. Тьюринга «Может ли машина мыслить» (1950). Им же был разработан наиболее эффективный и универсальный тест для определения уровня интеллектуальности (тест Тьюринга). Он опирается на систему вопросов и ответов, которая охватывает практически любую область интеллектуальной деятельности человека.

Система искусственного интеллекта способна решать самые разные задачи, но главными из них считаются: а) решение задач, б) принятие решений и в) распознавание объектов. Решение задач охватывает широчайший спектр вопросов от сложнейших математических задач до простых рассуждений, нахождения ответов на бытовые вопросы типа: какой обед можно приготовить из предложенного набора продуктов. Проблема принятия решений опирается на материал игровых стратегий (таких, как шахматы, шашки и т.п.).

Механизм распознавания образов использует так называемые эталонные образы, с которыми человек имеет дело в обыденной деятельности. Например, разные по форме, окраске, вкусу яблоки отождествляются с эталонным образом «яблоко» вообще. Понятие «образ» здесь отличается от одноименного психического понятия: это просто некоторое типовое родовое представление человека о группе видовых «предметов». Для этого машине необходимо узнавать объекты и подводить их под те или иные категории. Этим как раз и занимается прикладная лингвистика. Ее главная задача - моделирование речевой деятельности человека, анализ и синтез речи.

Без участия человека выполнение подобных задач невозможно. Необходимо «общение» человека с машиной. Машина, восприняв заданный текст, на него определенным образом реагирует: а) отвечает на вопрос, б) принимает информацию к сведению.

Для реагирования на тот или иной текст, необходимо сначала его понять. Процесс понимания у машин напоминает процесс понимания, происходящий в голове человека. Однако наука пока не может четко определить, что происходит в голове человека. Голова человека обычно сравнивается с «черным ящиком», представления о работе интеллекта основываются исключительно на входящей и выходящей информации. Ясно пока лишь, что для восприятия текста машиной необходимо структурировать смысл текста. Для этого машина должна хранить множество знаний о мире. Задача крайне сложная: так как знания бесконечны. Выход заключается в том, чтобы ориентировать машину только на одну, узкую, сферу знаний: биологию, математику, социологию.

В последнее время ученые увлечены принципиально новой идеей: нужно не только увеличивать объем памяти «умной» машины, но и создавать самообучающиеся системы. Смысл нового подхода в том, чтобы машина могла выполнять несколько важнейших операций:

а) извлекать из текста новую информацию,

б) включать ее в уже имеющиеся системы знаний,

в) при нехватке информации задавать для осмысления непонятого вопросы
человеку. По этому принципу работают многие компьютерные программы. Для использования языка кибернетическими системами, моделирующими восприятие и порождение речи, необходимы разработки структурных моделей фонологии, морфемики, морфологии и синтаксиса.