Каталог лингвистических программ и ресурсов в сети Программы анализа и лингвистической обработки текстов

 

Название Автор(ы), организация Комментарий
Link Grammar Parser http://bobo.link. cs.cmu.edu/link/ John Lafferty, Daniel Sleator, Davy Temperley, Carnegi Melon University, USA Link Grammar Parser — это синтаксический парсер1 английского языка. Программа распространяется бесплатно.
Russian Morphological Dictionary http://www. geocities.com/ Si I icon Valley/ Bit/1116/ Sergey Sikorsky ■ Программа для синтаксиче­ского и морфологического анализа русскоязычных тек­стов. Распространяется бесплатно.
On-line морфологиче­ский парсер http:// www.comptek.ru/ alta.html flndex Для просмотра результатов морфологического анализа нужно выбрать режим Раз­бор запроса.
Mystem http:// corpora.narod.ru/ mystem/ Илья Сегалович, Виталий Титов, компания flndex Компактный, очень быстрый и бесплатный морфологиче­ский парсер русскоязычных текстов, реализованный на ос­нове словаря А.А. Зализняка.

 


'



 


Парсер — анализатор.



 

Лингвоанали- затор http://www.rusf.ru/ books/analysis/ index.htm Д.В. Хмелев On-line версия программы ма­тематического анализа струк­туры текста. Целью анализа является определение бли­зости любого из предлагае­мых пользователем текстов к одному из авторских этало­нов, определенных заранее.
Программные продукты фирмы LingSoft http:// www.lingsoft.fi/en/ products.html LingSoft, Финляндия -■ Компоненты грамматическо­го разбора, морфологическо­го анализа и лемматизации (нормализации) для англий­ского, немецкого, финского, датского, норвежского, швед­ского, эстонского и русского языков. Это коммерческие продукты, которые могут быть использованы при разработ­ке других систем.
Бюро переводов http:// www.dialing.ru/ rml.htm компания Dialing Москва Анализ текстов для построе­ния систем автоматического перевода с русского на ан­глийский язык (и наоборот). Включает ряд автономных компонентов:
    — синтаксический анализа­тор текстов на русском языке; — морфологический анали­затор текстов на русском и английском языках; — построение конкордан­сов для заданной сово­купности текстов.
Система StarLing http:// С.А. Старостин СУБД StarLing, позволяющая работать с мультиязычными

 


 

starling.rinet.ru/ download.htm   текстами большой длины, с транскрипционными знаками, с удобным поиском, с анали­зом и синтезом словоформ по словарю.
Морфологиче­ский анализатор http:// starling.rinet.ru/ morph.htm С.А. Старостин ,,■ On-line версия программы морфологического анализа слов русского/английского языков. Позволяет получить для вводимого слова базо­вую форму и морфологиче­скую информацию. Програм­ма реализована на основе словарей А.А. Зализняка (русский язык) и В.К. Мюл­лера (английский язык).
ParaConc 0.7beta http:// www.ruf.rice.edu/ -barlow/ parabeta.html ParaConc 1 .Obeta http:// www.ruf.rice.edu/ -barlow/ parac.html Michael Barlow Две бесплатные beta-версии программы построения па­раллельного конкорданса, т.е. конкорданса, основанно­го на двух сравниваемых текстах. Тексты должны быть выравнены по параграфам (предложениям), т.е. иметь одинаковое число этих элементов.
WordSmith Tools http:// www.liv.ac.uk/ ~ms2928/ wordsmith/ Mike Scott Бесплатная демо-версия про­граммы WordSmith 3.0 для по­строения конкордансов. Кро­ме программы Word Smith, можно загрузить различные словари.
TextAnalyst 2.0 http:// www.analyst.ru/ index1.html? page=dload.htm Научно-произ­водственный инновационный центр «Микро­системы» Демо-версия. Позволяет по­строить семантическую сеть понятий, выделенных в обра­батываемом тексте, со ссыл­ками на контекст. Имеется

 




 

■ ■ . возможность смыслового по­иска фрагментов текста с уче­том скрытых в тексте смысло­вых связей со словами запро­са. Позволяет анализировать текст путем построения иерар­хического дерева тем/под­тем, затрагиваемых в тексте. Также имеется возможность реферирования текста. Еще одна компонента, TextAnalyst Lib, может использоваться для построения гипертексто­вых электронных книг.
Русский филолог http:// www.agama.com/ АО Агама Словарно-справочная систе­ма по русскому языку. Вклю­чает в себя ряд словарей, в том числе морфологический, словообразовательный и сло­варь синонимов/антонимов.
Лингвистические компоненты, словари и биб­лиотеки классов http:// linguist.nm.ru/ Андрей Коваленко Авторская страничка веду­щего разработчика компании Рэмблер, на которой пред­ставлены его лингвистиче­ские разработки. Можно ска­чать описания и демо-версии компонентов.
netXtract http:// www.netxtract.com/ 2000 Relevant Software Inc. Замечательная компонента, подключаемая к Microsoft Internet Explorer, которая по­зволяет получить упорядо­ченный индекс слов в загру­женном HTML документе. Выбранные слова по жела­нию заносятся в персональ­ную базу знаний, которая по­зволяет систематизировать найденные документы удоб-

 


 

    ным образом. Можно скачать
    бесплатную версию.
WordTabulator СВ. Логичев, Позволяет построить упоря-
v2.2 1997—2002 доченные индексы слово-
http://www.rvb.ru/   форм или словосочетаний
soft/index, htm I   заданной размерности для
    множества входных текстов.
    Понимает тексты в основных
■■■   русскоязычных кодировках и
    может обрабатывать доку-
    менты в формате HTML 4.01,
    игнорируя их разметку.
WordStat А.Г. Дубинский, Бесплатная утилита2 подсче-
http:// та частоты встречаемости
dubinsky.nm.ru/   различных слов в текстовых
wordstat.htm   или html-файлах.
Технологии Гарант-Парк- Сайт, на котором представ-
поиска и анализа Интернет лены разработки известной
текстовой   компании «Гарант-Парк-Ин-
информации   тернет». Среди представ-
http://www.rco.ru/   ленных технологий:
    — анализ и классификация
    текстов, автоматическое
    реферирование;
    — морфологический, син-
    таксический и семанти-
    ческий анализ текста;
    — средства навигации по
    большим массивам
    текстов;
  — различные научные пуб-
    ликации авторов проекта.

2 Утилита — программа обслуживания, системная программа, предназначенная для оказания услуг общего характера пользователям и обслуживающему персоналу си-

стемы обработки информации.


 




Психолингвистические программы

 

Название Автор(ы), организация Комментарий
ПСИ-Офис Вадим Сысуев Система психолингвистиче-
версия 2.1   ского анализа текстов, вклю-
http://   чающая три компоненты:
psy-two.narod.ru/    
    — программа поиска вло-
    женных слов в тексте,
    т.е. слов, спрятанных
    внутри и на переходах
    между словами;
    — программа поиска повто-
    ряющихся фрагментов
    текста при анализе «ав-
1   томатического письма»
    (такие тексты пишутся с
    целью анализа текущих
    подсознательных про-
    цессов);
    — программа синтеза под-
    сознательного компонен-
    та текста. Поддержка
    русского (словарь
    690 тыс. слов) и
    английского (словарь
    430 тыс. слов) языков.
ВААЛ-2000 В.П. Белянин, Психолингвистическая экс-
http:// д-р филол. пертная система лексическо-
vaal2000.newmail. наук, МГУ го и контент-анализа текстов.
ru/vaal2000.htm В.И. Шалак, Основные задачи — прогноз
  канд. филос. эффекта неосознаваемого
  наук (Институт воздействия текста на мас-
  философии РАН) совую аудиторию, анализ
    текстов с точки зрения такого
    воздействия, генерация тек-
    ста с заданным вектором

 


 

    воздействия, выявление лич-
    ностно-психологических ка-
    честв автора текста. Успеш-
    но используется в Госдуме,
    Правительстве РФ, крупных
    банках и PR-компаниях.
ПРИЕМЫ Система Коммерческая программа,
ЖУРНАЛИСТИ- «ТРИЗ-ШАНС», представляющая собой кон-
КИ & PUBLIC Санкт-Петербург сультанта, помогающего
RELATIONS,   пользователю при написании
версия 2.03,   различных текстов. Пользо-
  ватель выбирает ряд пара-
http://www.triz-   метров, характеризующих
chance.spb.ru/   желаемый результат, а про-
    грамма выдает ему рекомен-
    дации по написанию текста
    и иллюстрирует их примера-
    ми. В основе программы —
    анализ 12 500 текстов масте-
  ров русского языка, начиная
    от писателей-классиков и
    заканчивая современными
    журналистами и политиками.
  К сожалению, в программе
    отсутствуют возможности
    анализа написанного поль-
    зователем текста. Для загруз-
    ки доступна демо-версия,
  являющаяся облегченным
    вариантом профессиональ-
    ной версии. Демо-версия
    также включает руководство
    пользователя и демонстра-
    ционный обучающий ролик.
    Программа требует для ра-
    боты русские Windows 9x/
    2000/NT и Microsoft Word.

 





 

    ну или организацию. Исполь-
    зует для работы словарь лек-
  сической информации, кото-
    рый на сегодняшний день
    включает более 7000 элемен-
    тов. Язык реализации — ан-
    глийский.
Cyrano Server Nando.net On-line версия программы
http://www.   генерации любовных писем.
nando.net/toys/   Пользователь задает стиль
cyrano/version2/ сочинения,свое имя, обра-
compose-   щение к любимой и некото-
cyrano.html   рые атрибуты, ее характери-
    зующие, и программа ловко
  сочиняет письмо нужной
    тональности. Язык реали-
    зации — английский.
Письмовник MediaLigua Ltd., Автоматическое составление
http://www. 1995—2002 и перевод (русско-английский /
medialingua.ru/   англо-русский) деловых пи-
pismovnik.html   сем и документов. Коммер-
    ческая система для Windows
    95/98, $49.
A.L.I. C.E Dr. Richard Говорящая программа. В ос-
http://www. S. Wallace нове технологии, на которую
alicebot.org/   опирается A.L.I.С.Е., лежит
alice_page.htm   использование AIML (специ-
    ализированного языка раз-
    метки для искусственного
    интеллекта). В разделе
  downloads доступен исход-
    ный код и различные импле-
    ментации программы.
The Dada Engine Andrew С Bulha Генератор случайных тек-
http://dev.null.org/   стов на основе заданной
dadaengine/   грамматики (на английском
    языке).

 

 


 

Sakrament Text-to-Speech Engine v2.0 http:// sakrament.com/ компания «Сакрамент», 2002 Система синтеза русской речи,созданная минской компанией «Сакрамент». Система польностью соответствует стандарту Microsoft Speech API (SAPI) 5.1. Позволяет произносить тексты мужским и женским голосами, делая при этом инфонационные паузы, изменяя по желанию пользователя тон и тембр речи.
Аки Росс http:// www.akirossbot. narod.ru/ 1 Альберт Товмасян, 2002 - Shareware — программа, предлагающая общение на русском языке. Специаль­ный plug-in позволяет ис­пользовать анимацию в ви­де очаровательной девуш­ки-собеседника по имени Аки Росс (так звали герои­ню компьютерного мультика «Final Fantasy»). База зна­ний программы не столь об­ширная, но теоретически ее можно улучшать и допол­нять (используется язык разметки AIML). Незареги­стрированная версия запускается всего 10 раз сеансами по 2 минуты.
PAI V3.01 http://utenti.quipo. it/claudioscordino/ pai.html Claudio Scordino, 2002 Programmable Artificial Intelli­gence (PAI), или Программи­руемый Искуственный Ин­теллект, — это freeware про-

 




грамма, способная общаться с пользователем на англий­ском языке. Что наиболее интересно в PAI, так это спо­собность обучения. Пользо­ватель постепенно может научить программу понимать нужные фразы, слова, глаго­лы и даже команды! Реали­зована на языке C++ для Linux, FreeBSD и Windows.

Системы обработки естественного языка (NL-Processing)

 

Название Автор(ы), организация Комментарий
Natural Language Projects at ISI http://www.isi.edu/ natural-language/ nlp-at-isi.html ■ Univ.of Southern California/ Information Science Inst, 1999—2001 Описание группы проектов по вычислительной лингви­стике и машинному переводу. Webclopedia — проект, свя­занный с созданием инфор­мационных агентов, способ­ных генерировать ответы пользователю на основе ана­лиза разнородных коллекций ресурсов, доступных в сети. ONTOSAURUS — это онто­логический тезаурус, вклю­чающий 90000 концептуаль­ных сущностей. SUMMARIST — мультиязыч-ная система реферирования текстовой информации. ReWrite — система двуязыч­ного перевода,основанная на статистическом анализе пар текстовых корпусов.

 

 


 

Следопыт 3.0 MediaLingua Интеллектуальная поисковая
http:// Ltd., 2001 система, применимая для
www.sledopyt.ru/   смыслового и нечеткого по-
    иска документов на русском
    и/или английском языках.
    При поиске учитывается мор-
    фология и изменение грам-
    матических форм элементов
    поискового запроса. Понима-
    ет все основные форматы
    документов для Windows.
    Цена от $9,9 до $1290 в за-
    висимости от комплектации.
Поисковая ВЕЛТОН. Персональная поисковая си-
система Алхимик SOFT, 2002 стема Алхимик, предназна-
http://www.soft.   ченная для анализа и поиска
velton.net.ua/   русскоязычных документов.
langs download.   Программа использует фраг-
html   менты семантического сло-
    варя профессора В.А. Тузо-
    ва. Входными документами
    могут быть файлы в форма-
    тах MS Word, HTML и TXT.
ARM Engine 4.0 ABBYY Software ABBYY Retrieval & Morphology
http://www.abbyy. House, 2001 (ARM) Engine — коммерче-
ru/products/arme/   ская инструментальная си-
index.htm   стема, позволяющая встраи-
    вать в разрабатываемые при-
    ложения функции полнотек-
    стового поиска и морфологи-
    ческого анализа текстов.
    Поддерживает практически
    все европейские языки, вклю-
    чая русский. Реализована
    в виде API с использованием
    технологии СОМ-объектов.
    Демо-версию можно полу-
    чить бесплатно.    

 



 


6 Заказ 105


 

NeurOK Semantic НейрОК Программные продукты для
Suite Интел софт, поиска и анализа в текстовых
http://soft.neurok. массивах информации, реа-
ru/products/ лизованные с использовани-
semantic.shtml   ем технологии нейронных
  . сетей. Серьезные цены соот-
!■ ■ '■ • !   ветствуют серьезности са-
    мих продуктов.

 

  Коллекции ресурсов
Название Автор(ы), организация Комментарий
Каталог SIL International Обширный каталог программ
программ (Summer Institute по вычислительной лингви-
по вычисли- of Linguistics) стике. Представленные в
тельной   каталоге программы носят
лингвистике   явно академический харак-
http://www.sil.org/   тер и требуют значительных
computing/   усилий для изучения и при-
    менения. Все программы, а
    их более 60, являются бес-
    платными и доступны для
    on-line загрузки.
Каталог SIL International Обширная коллекция ссылок
программ   на программы чрезвычайно
по вычисли-   широкой лингвистической на-
тельной - правленности в сети Internet.
лингвистике   Но совсем нет программ, по-
в сети Internet   священных русскому языку.
http://www.sil.org/   Представлены как бесплат-
linguistics/   ные, так и коммерческие
computing.html   программы.
Каталог про- Michael Barlow Интересная подборка доступ-
грамм в Corpus   ного в сети лингвистического
Linguistics программного обеспечения.

 

 


 

http://www.ruf.    
rice.edu/-barlow/ .. ■ • ■ ;,
corpus. html#    
Software    
Каталог ресурсов Harald Klein Обширная компиляция ссы-
по анализу •" • : . > ' ' лок по проблеме анализа
текстов ■ С HNfil . ■ текстов (на английском язы-
http://www.intext. ■ <\ •■■: ке). Большой раздел посвя-
del textanae.htm   щен тематическим компью-
    терным программам.
Ресурсы, Matthias Электронный каталог ресур-
связанные Romppel сов, связанных с анализом
с анализом   текстов (на англ. языке).
текстов   Библиографии, программное
http://www.   обеспечение, адреса иссле-
content-analysis.   довательских организаций,
de/index.html архивы электронных текстов
    и другое.
Русский Юрий Коряков Авторская коллекция ссылок
Лингвистический   на языковые ресурсы по
указатель создан ■ ■ ■ . следующим разделам:
15 мая 1999   — языки народов России
http://isabase.   (славянские, уральские,
philol.msu.ru/   кавказские и др.) и мира;
—jirik/rusling.html    
    — некоторые направления
    лингвистики (компарати-
    вистика, социолингви-
    стика, вычислительная
    лингвистика, типология);
    — словари;
    — адреса российских орга-
    низаций, связанных
    с лингвистикой.
Полезныессылки А.А. Поликарпов, Большая коллекция ссылок
для лингвистов МГУ на лингвистические ресурсы,

 




 

 
http://humlang.     проекты, конференции, орга-
newmail.ru/     низации.
h_link_r.htm      
Справочно-ин-   МО «ЭЛЕКС», Замечательный ресурс для
формационный   истинных любителей рус-
портал     ской словесности. Включает
«Русский язык»     онлайновые словари рус-
http://www.   ! ского языка:
gramota.ru/ index.html     — орфографический сло-
      варь русского языка под
    ред. В.В. Лопатина;
       
      — словарь трудностей про-
Г' ;*•;     изношения и ударения
      в современном русском
      языке;
      — новый словарь русского
      языка. Толково-словооб-
      разовательный;
      — русское словесное уда-
      рение. Словарь нарица-
      тельных имён;
      — русское словесное уда-
      рение. Словарь имён
      собственных.

■.

Словари и тезаурусы

 

Название Автор(ы), организация Комментарий
Словарь В. Даля http://vidahl. agava.ru/ On-line версия знаменитого словаря В. Даля «Толковый словарь живого великорус­ского языка».

 


 

On-line словари 1997—2000 Коллекция on-line словарей:
Издательского ETS Publishing анатомический (латынь),
Дома «ЭТС» House уфологический, словарь со-
http://www.ets.ru/   кращений, иностранных слов,
udict-r.htm   финско-русский, немецко-рус-
    ский, англо-русский фразео-
    логический и ряд других. Кро-
  ме этого, на сайте представ-
    лены языковые программы.
Словари C.A. Старостин On-line версии словарей
Ожегова ; С.Н. Ожегова и А.А.Зализ-
и Зализняка : . няка.
http://starling. ; ..  
rinet.ru/cgi-bin/ :  
main.cgi?flags=    
wygnmnl    
Acronim finder Mountain Полный словарь акронимов и
http:// Data Systems сокращений английского
acronymfinder.com   языка. Содержит более
    173 тыс. элементов.
Lexical FreeNet Datamuse On-line тезаурус английского
http://www. Corporation языка. Может использовать-
lexfn.com/   ся для любых мыслимых
    целей: поиска синонимов,
:   связанных слов, подбора
    рифм, орфографической
    проверки и т.д.
The Wordsmyth Wordsmyth On-line версия образова-
Educational Collaboratory тельного словаря-тезауруса
Dictionary английского языка. Содер-
Thesaurus   жит около 50 тысяч корен-
(WEDT)   ных слов. Пользователь
http://www.   может получить расклад
wordsmyth.net/   интересующего слова по
    слогам, его произношение,
  список всех словоформ и
    толкование.

 




Толковый Merriam-Webster On-line версия знаменитого
словарь Incorporated толкового словаря англий-
Merriam-Webster   ского языка.
http://www.m-w.   '■■ '■
com/    
Babylon.com Babilon.com Ltd. Сайт, предоставляющий раз-
http://   личные услуги: мультиязыч-
www.babylon.com/   ный перевод, словари и спра-
    вочники, преобразование од-
    них мер в другие и т.д. Поль-
    зователь получает доступ
    к ресурсам системы после
    установки на свою локаль-
    ную машину интерфейса
    Babylon. Он может опреде-
    лять состав необходимых
  . ■ ему словарей, языковые на-
    стройки и режимы работы
    (off-line или on-line) и даже
  создавать свои собственные
    словари. Плата за пользова-
    ние не взимается!
РУБРИКОЙ Russ Portal В настоящее время на сер-
http://www. Company Ltd. вере опубликованы:
rubricon.ru/  
    — «Большая советская
  энциклопедия»
    (1969—1979);
    — «Иллюстрированный
    энциклопедический
    словарь» (1998);
    — «Толковый словарь жи-
    вого великорусского язы-
    ка» Владимира Даля
    (1863—1866);
    — «Рок-энциклопедия» Сер-
    гея Кастальского (1998);

 

  ■■ '.''■' ■ : ■ — Энциклопедический сло­варь «История Отече­ства»; — Энциклопедический сло­варь «Всемирная история».
British National Corpus (BNC) http://info.ox. ac.uk/bnc 1995 Oxford University Press ■ ■ ■ Коллекция более чем 100 мил­лионов слов современного английского письменного и устного языка. В режиме on-line поиска пользователь может найти примеры упот­ребления как отдельных слов, так и выражений.
Англо-русский словарь Мультилекс™ 1.0 http:// www.multilex.ru/ online.htm MediaLingua Ltd. 2000 . ■ On-line версия знаменитого трехтомного словаря НБАРС под редакцией проф. Э.М. Медниковой и акад. Ю.Д. Апресяна (250 000 сло­варных входов, 2 300 000 ан­глийских и русских слов).
Обратные и частотные словари русского языка http://speakrus. narod.ru/ zaliznyak/ zalizn.htm Арнольд Обратный и обычный слова­ри, образованные из словаря А.А. Зализняка (93 392 сло­ва). Обратный и обычный словари Про-Линг (125 723 слова). Обратный, обычный и частотный сло­вари, полученные в резуль­тате анализа произведений русской литературы XIX—XX вв. (162 232 слова).
Словарь сокращений русского языка http:// www.sokr.ru/ Студия Артемия Лебедева On-line словарь сокращений русского языка, включающий на сегодня более 53 000 статей.


 

    «Словарь сокращений рус-
  ского языка» {1984);
    «Новый словарь сокращений
    русского языка» (1995);
... .I ■ ' ■ «Новые сокращения в русском
языке 1996—1999» (1999).
Гиперсловарь РосНИИ Гиперсловарь «Ариадна» —
Ариадна искусственного проект создания универсаль-
http:// интеллекта ной среды для систем авто-
www.artint.ru/   матической обработки рус-
packin/abrial/   ского текста. По форме ги-
ariadna.htm персловарь является базой
    данных Абриаль, включаю-
    щей грамматическую компо-
    ненту на основе словаря
■■ " ! ■ .   А.А. Зализняка, позволяю-
. ... . ,■■. .   щую получать склонения и
■ ■ спряжения слов и морфо-
    логическую компоненту.

■■■;■■,■

 


РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА

Основная

1. Информатика для юристов и экономистов / СВ. Симонович, ГА. Ев­сеев, В.И. Мураховский, А.Ю. Казуто; под ред. СВ. Симоновича. СПб.: Питер, 2001.

2. Кудрявцева Т.Н. Введение в Интернет: Методическое пособие. Ярос­лавль: МУБиНТ, 2002.

Электронные ресурсы

3. Каталог лингвистических программ и ресурсов в Сети [Электрон­
ный ресурс] / Сост. СВ. Логичев; Русская виртуальная библиоте­
ка. М.: РВБ, 1999—2004. — Режим доступа: http://www.rvb.ru/soft/
catalogue/catalogue. html.

4. Компания ПРОМТ: технологии машинного перевода [Электрон­
ный ресурс]. М.: ООО «ПРОМТ», 2003—2004. — Режим доступа:
http://www.translate.ru.

5. Международная конференция ДИАЛОГ [Электронный ресурс] / Ас­
социация «Компьютерная лингвистика и интеллектуальные тех­
нологии». М.: КОЛИНТ, [2004] — Режим доступа: http://www.
dialog-21.ru.

6. Языковые и лингвистические проекты в Интернете [Электронный
ресурс]: Указатель ресурсов / Веб-каталог EGO: страны мира, язы­
ки и Интернет. М., 1999—2002. — Режим доступа: http://www.Hnks-
guide.ru/sprachen/yazyki-projekty.html.


ОГЛАВЛЕНИЕ

1. ИНФОРМАЦИЯ. ИНФОРМАЦИОННЫЕ

ТЕХНОЛОГИИ.......................................................................3

1.1. Информация.................................................................... 3

1.1.1. Информационный обмен, сигналы, данные.... 3

1.1.2. Методы воспроизведения

и обработки данных............................................ 5

1.1.3. Понятие информации................ ,....................... 9

1.1.4. Понятие контекстного метода

и особенности информационного процесса

в вычислительной технике.............................. 10

1.1.5. Свойства информации...................................... 12

1.2. Данные........................................................................... 17

1.2.1. Носители............................................................ 17

1.2.2. Операции............................................................ 18

1.2.3. Основные структуры данных.......................... 20

1.3. Автоматическая обработка........................................ 22

1.3.1. Состав вычислительной системы.................... 22

1.3.2. Классификация прикладных программ.......... 24

1.3.3. Периферийные устройства.............................. 26

1.4. Интеллектуальные информационные системы........ 28

1.4.1. Искусственный интеллект

(Artificial Intelligence)........................................ 28

1.4.2. Нейронные сети................................................ 29

1.4.3. Экспертные системы........................................ 31


 

 


2. ОБЗОР ЛИНГВИСТИЧЕСКИХ ПРОГРАММ.....................37

2.1. Виды лингвистических программ.............................. 37

2.1.1. Текстовые процессоры...................................... 40

2.1.2. Программы анализа и лингвистической
обработки текстов.............................................. 47

2.1.3. Генераторы текстов и «говорящие»
программы.......................................................... 51

2.2. Машинный перевод...................................................... 53

2.2.1. Основные этапы развития

машинного перевода......................................... 53

2.2.2. Как переводит компьютер................................ 54

2.2.3. Классификация систем..................................... 58

2.2.4. Инновационные технологии

компании ПРОМТ............................................. 61

2.3. Компьютерная лингвистика:

нестандартные применения......................................... 63

2.3.1. Определение языка сообщения........................ 63

2.3.2. Взлом шифров.................................................... 64

2.3.3. Установление авторства................................... 65

2.3.4. Построение роботов-поисковиков

и снифферов....................................................... 65

2.3.5. Построение роботов-автоответчиков.............. 66

ЗАКЛЮЧЕНИЕ.......................................................................... 68

ПРИЛОЖЕНИЕ......................................................................... 69

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА............................................ 89


Учебное издание



OCUMENT_ROOT"]."/cgi-bin/footer.php"; ?>