Диалоговые информационные системы

Итак, будущие машины – это мультимодальные и мультимедийные системы, т.е. такие системы, которые будут использовать, как и человек, различные каналы ввода и вывода информации. Следует также отметить, что в настоящее время практически любая современная компьютерная система должна представлять собой диалоговую систему (рис. 1.5), т.е. такую систему, пользователь которой мог бы с ней общаться как с равноправным коллегой по работе. Особенно это касается интеллектуальных систем.

Вообще можно выделить следующие классы практических систем распознавания и синтеза речи:

1. Синтезаторы речи. Наибольший стимул их использования – это обслуживание слепых. Такие системы используют речевой дисплей, включая "подзвучивание" клавиатуры. С их помощью, например, можно осуществлять чтение электронной почты на расстоянии по телефону. В США производится обслуживание клиентов по телефону с использованием кнопочного набора (tuch-tone) путём вывода синтезированного речевого сообщения;

2. Системы распознавания речи. В чистом виде – это "голосовая мышь" (Voice Mouse), для которой часть команд говорится голосом. Сравнительно недавно появились первые системы диктовки (Dictation Machines) – пишущие машины с голоса. Для них пока ещё существуют жесткие требования к манере пользователя говорить и требуется настройка на голос;

3. Системы распознавания голоса. Это системы, используемые преимущественно в сфере криминалистики, а также в системах защиты доступа.

4. Диалоговые системы. Это наиболее привлекательные системы, активно использующие и распознавание, и синтез речи, т.е. позволяющие вести диалог в форме речи. К ним относятся справочные центры (Call Centers), где кнопочный набор запроса заменяется на голосовой; интеллектуальные автоответчики (Phone Secretary), осуществляющие селекцию звонков, избирательную реакцию на звонки (в одних случаях – соединить по другому телефону, в других – послать сообщение на пейджер и т.д.);

Напомним также, что для реализации речевых систем необходимо использовать знания из нескольких предметных областей и решить ряд основных задач (рис. 1.6).

Перечислим некоторые конкретные применения речевого интерфейса, которые уже существуют и используются в различных прикладных системах (Кучеров В.Я..1983кн-Синте_Р). К числу таких систем можно отнести следующие:

• системы поддержки безбумажных технологий: диктовка и формирование текстовых файлов на компьютере, системы подготовки документов, редакционно-издательские системы;

• речевые интерфейсы для пользователей-инвалидов по слуху и зрению;

• системы компьютерной телефонии (телефонные диалоговые информационно-справочные системы, включая справки по паролю, телефонные автосекретари, речевая электронная почта; речевой набор номера телефона и др.);

• системы речевого управления (информационные и навигационные системы, диспетчерские системы управления воздушным и наземным транспортом, тренажеры систем управления; интеллектуальные здания и др.);

• системы защиты доступа к базам данных, информации и объектам с использованием принципа парольных фраз ("Голосовой ключ");

• системы обнаружения голосовых сообщений (детекторы речи);

• системы защиты речевых сообщений (компрессия речи для повышения эффективности криптографической защиты речевых сообщений, повышение помехоустойчивости передачи речевых сообщений по сверхузкополосным каналам передачи данных и т.п.);

• системы-чтецы (например, система голосовых объявлений в общественном транспорте; системы голосового оповещения населения в чрезвычайных ситуациях);

• системы для криминалистической экспертизы на основе анализа голоса и речи;

• системы обучения языкам (в частности, иностранным), в число которых включаются также «говорящие» словари, речевые разговорники, системы обучения правильному произношению иностранных слов и т.п.;

• компьютерные системы обучения по различным предметным областям, использующие мультимодальный интерфейс;

• игровые компьютерные программы (в частности, компьютерные развивающие игры для детей).

Заключение