Модель и оригинал. Общие принципы построения моделей

Р. Г. Пиотровский

ЛИНГВИСТИЧЕСКИЙ АВТОМАТ

В исследовании и непрерывном

обучении)

Е дополненное и исправленное издание

Книга издана при финансовой поддержке фонда РГНФ, грант 07-04-90402 "Системно-семантический компьютерный анализ и синтез языка и речи"

Санкт-Петербург

Издательство РГПУ им. А. И. Герцина

ББК Печатается по рекомендации кафедры

П ЮНЕСКО и решения редакционно-изда-

тельского совета РГПУ им. А.И.Герцена

Рецензенты:

Аннотация:

Второе издание учебного пособия «Лингвистический автомат (в исследовании и непрерывном обучении)» имеет целью определить и проанализировать основные черты современной научной парадигмы языкознания. Эта последняя начала формироваться более ста лет тому назад и уверенно вытесняет безраздельно господствовавшие в XIX и первой половине XX вв. описательско-резонёрские шаблоны “традиции-онной” лингвистики. Основной материал, на котором строится эпистемо-логический и онтологический анализ и общие выводы, приводимые в книге, явились теоретические психо-, инженерно- и дидактико-лингви-стические результаты, полученные за последние 50 лет в международной группе “Статистика речи” и других отечественных и зарубежных коллективах.

Книга адресована специалистам в области информатики и методики преподавания языков, филологам и психологам.

Пиотровский Р.Г.

Лингвистический автомат (в исследовании и непрерывном обучении): ― 2-е изд., доп. и испр. ― СПб: Изд-во РГПУ

им. А. И.Герцена, 2008. ― с.

ISBN 978 ― 5 ― 8064 ―

ББК

ISBN 978 ― 5 ― 8064 ― © Р.Г.Пиотровский, 2008

Издательство РГПУ

Им. А.И. Герцена

Посвящается моей жене

Анне Александровне Пиотровской

От автора

Предлагаемое вниманию читателя 2-е издание учебного пособия опирается в основном на публикациях автора и его учеников за последние 20 лет, а также на лекциях, которые читались автором, начиная с конца 90-х годов, студентам и аспирантам, специализирующимся в области теории языка, инженерной лингвистики, информатики и вычислительной техники в Университетах России, а также в Университетах, Политехнических и Педагогических институтах ближнего и дальнего зарубежья. В пособии обобщается также теоретический опыт и практические результаты по компьютерному решению лингвистических задач, полученные за последние сорок лет автором, а также его учениками и коллегами по Международной исследовательской группе "Статистика речи". Всем членам этого научного коллектива, исследовательский труд которых в той или иной степени нашел отражение в книге, автор приносит свою благодарность.

Автор выражает искреннюю признательность профессорам Г.В.Елизаровой, В.А.Козыреву, И.А. Щировой, без организационной и профессиональной помощи которых книга не смогла бы увидеть свет.

Обсуждение с профессорами П.М.Алексеевым, Л.Н.Беляевой,

Р.К.Гариповым, А.В.Зубовым, Ю.А.Косаревым, А.Н.Попеску, Д.Л.Спиваком, канд. техн. наук и доктором пед. наук К.Р.Пиотровской, кандидатами медиц. наук В.Э.Пашковским и В.Р.Пиотровской узловых вопросов инженерной и психиатрической лингвистики, тюркологии, информатики и психолингвистики способствовало более четкому изложению многих теоретических положений в книге. Всем им я приношу свою сердечную благодарность. Особую признательность я должен выразить заведующему Лабораторией инженерной лингвистики РГПУ им. А.И.Герцена Ю.В.Романову, оказавшему неоценимую помощь при редактировании и подготовке книги к печати.

Я глубоко обязан моей жене А.А.Пиотровской за постоянную поддержку и мудрые советы не только при написании и подготовке 2- го издания этой книги, но и в ходе всей моей работы в области инженерной лингвистики.

0. ВВЕДЕНИЕ *)

Развитие и прогресс наук характеризуется периодическими сменами их парадигм, т.е. образцов решения научных проблем [41]. Каждый такой образец представляет совокупность фундаментальной теории и соответствующей ей приёмов исследования. Если говорить о физике, выступавшей в роли науки-лоцмана, то она за последние полтора столетия дважды меняла свою парадигму, переходя от ньютоновского детерминизма к квантовой механики, а затем к эволюционно-синергетической концепции.

Языкознание также меняло и меняет свои парадигмы. Первая половина ХХ в. ознаменовалась переходом от описательной парадигмы, ориентировавшейся на диахроническом представлении отдельных лингвистических явлений к новой парадигме (назовём её структурной), направленной на синхроническое изучение фонологических, грамматических и даже лексических систем. Компьютерное моделирование лингвистических систем и процессов, начавшееся на рубеже 60-х гг. подготовило новую смену парадигмы языкознания.

Сущность этой новой доказательно-экспериментальной парадигмы, назовём её условно системно-синергетической парадигмой (ССП), состоит в поиске скрытых от прямого наблюдения механизмов самоорганизации и саморазвития систем языка и речи. Этот поиск опирается на фун-даментальное представление о языке как об открытой саморазвивающейся не узуальной "мягкой" системе. Основным приёмом исследования является здесь метод моделей и гипотез, сочетающийся с широким набором опытов различной природы (в том числе и компьютерных), опирающихся на общую для экспериментальных наук схему. По ходу изложения мы постараемся вскрыть и описать каждую из характерологических черт новой лингвистической парадигмы в отдельности.

______________________________________________________

*) Во Введении использованы материалы таких работ автора как: "MT in the former USSR and in the Newly Independent States (NIS). Prehistory, Romantic Era and Prosaic Time"//Early Years in Machine Translation. Memoirs and biographies of pioneers/Ed. by J.Hutchins. Amsterdam – Philadelphia: John Benjamins Publishing Co, 2000 и "Лингвистическая синергетика; исходные положения, первые результаты, перспективы". СПб: Филологический факультет СПбГУ, 2006

Хотя всё расширяющееся использование вычислительной техники в исследованиях речи и языка является лишь инструментальной приметой новойлингвистической и лингво-дидактической парадигмы, оно энергично стимулируется нуждами современной информационной индустрии.

Сама же идея моделирования речемыслительной деятельности (РМД) имеет длительную историю. Созданием гуманоиднов занимались инженеры, ученые-теоретики, писатели и художники. На этом пути конфликтовали два направления, отражающие два подхода в исследовании поведения человека − системно-классификационный (номотетический) и индивидуально-идиографический. Первый характерен для естественных и технических наук. Он ориентирует ученого на выявление в исследуемом материале имманентной структуры исследуемого объекте и внутренних, не наблюдаемых (синергетических) механизмах, обеспечивающих саморегуляцию и устойчивость функционирование и развитие этого объекта. Эти структуры и механизмы представляются в виде обедненных, но зато легко формализуемых инвариантных схем. Каждая из них, описывая сходные факты, становятся базой для построения технических устройств, выступающих в качестве аналогов исследуемых явлений и объектов. Второй подход направлен на исчерпывающее описание отдельно взятого и изъятого из системы элемента или его свойства лингвистического), имеющих в перспективе с точки зрения языковеда-традиционалиста особое значение для понимания сущности всего явления.

История языкознания служит примером соревнования и борьбы обоих подходов. Первые попытки применить номотетический подход просматриваются в нормативных грамматиках и словарях, начиная с египетского Рамесейского ономастикона (начало II тысячелетия

до н.э.) и сочинений Панини (середина I тысячелетия до н.э.). Однако на протяжении всей истории языкознания системно-классификационный подход увязал в размытости лингвистических объектов, в их нечеткой динамике и в разнообразии восприятия и направлений. Эти затруднения

являются основной причиной того, почему установка на выявление и формадьное представление общих закономерностей и структур в языке и речи языке постоянно наталкивается на инстинктивную привязанность лингвиста к описанию отдельного конкретного факта. А он― этот факт, взятый сам по себе, как говорил замечательный русский филолог акад. В.Ф.Шишмарев, просто глуп. В настоящее время этот идиографизм прослеживается в концепциях т.н. когнитивной лингвистики и лингви-стики текста, пытающихся стать альтернативой номотетической структурного языкознания 60-х годов.

Если говорить об истории моделирования языка и речи, то на осно-ве номотетической методики создавались технические устройства, кото-рые слишком упрощенно имитировали некоторые физические действия и элементарные логические операции, производимые человеком. Поэтому основная опасность, подстерегающая номотетическое моделирование разума и РМД человека, состоит в том, что в модели могут быть потеряны наиболее существенные черты языка и речи. Стремясь избежать прими-тивизации природы РМД, ученые-гуманитарии и художники слова описывают ее, опираясь на свою интуицию и способность постижения сути вещей через их индивидуально-идиографическое описание. При этом они стремятся проникнуть в самые глубины речевого поведения человека и тайны управляющего этим поведением базового сознанием с его логи-ческими механизмами, а также таинственные синергетические пружины под- и сверхсознания. К сожалению, идеографические модели имеют не конструктивный, но описательно-иллюстративный характер. Они не мо-гут репродуцироваться техническими устройствами и воспроизводить артефакты, являющиеся аналогами РМД человека.

Появление в конце 40-х гг. компьютеров, способных выполнять не только вычислительные, но и логические операции, стимулировало у математиков и лингвистов заманчивую идею объединиться и выра-ботать единый подход для решения на компьютере лингвистических задач. В результате к началу 60-х годов сформировалось научное направление, получившее в русской научной традиции название инженерная лингвистика (ИЛ). В 80-е гг. этот термин был калькирован на Западе в форме language engineering. Уже первые шаги развития ИЛ показали, что механическое объединение обоих подходов невозможно. Одновременно стали выявляться эпистемологические и онтологические конфликты и барьеры, отделяющие естественный язык (ЕЯ) от языка компьютера. Дело в том, что, приступая в конце 50-х гг. к созданию компьютерных моделей языка и речи, математики-программисты и лин-гвисты-теоретики, использовали идущие от Лейбница Рассела и раннего Витгенштейна идеи дискретно-атомарного и системного строения языка. Согласно им ЕЯ, подобно искусственные языкам науки и управления, представляет собой особый вид логического исчисления высказываний (calculus). Истины ради напомним, что главные идеологи этого подхода -

понимали, что операции лингвистического исчисления могут применяться только относительно некоторого идеально нормализованного текста. Что же касается реальной устной и письменной речи, то она искажает идеальные модели. Здесь на каждом шагу встречаются accident de paroles, т.е. обрывки фраз, обмолвки; человек начинает говорить не то, что он хотел сказать, проглатывает слова и звуки. Эти явления в формализованный язык компьютера ввести невозможно [77а. С. 248].

Тем не менее десятки, если не сотни математиков, информатиков и программистов, не получивших профессиональной лингвистической выучки вместе с молодыми лингвистами были настолько увлечены идеей логико-лингвистических исчислений, что не заметили этих предупреждений. И хотя на начальном этапе развития ИЛ эта идея была полезным творческим заблуждением, энергия которого стимулировала появление многих интересных системных лингвистических исследований, постепенно по мере ее абсолютизации она стала ловушкой на пути создании реально работающих систем автоматической переработки текста (АПТ) Анализ этих неудач показал, что ЕЯ не является исчислением, но есть открытая коммуникативная система, которая не столько применяет узуальные, т.е. социально закрепленные жесткие связи между означающим и означаемым знака и между различными знаками, сколько использует вторичный семиозис, т.е. неисчисляемые окказиональные ассоциации между компонентами знаков (48. С. 249 ―252; 61а. С. 44 ―47) Поэтому ЕЯ имеет нечетко-множественное и континуальное построение, применяющее нечеткую логику и отношение толерантности между его элементами. Поэтому эпистемологическое допущение, по которому РМД человека как и все его поведение может быть полностью формализована в терминах единой системы эвристических правил, для современного этапа развития науки неверно.

Одновременно выясняется, что между ‘‘языком’’ компьютера и языком человека существует барьер отторжения, ― барьер между описаниями стационарных процессов в неживой материи и описанием нестационарных процессов, характеризующих РМД человека. Он реализуется в таких "генетических" антиномиях , как

― противоречие между открытым, вечно развивающимся ЕЯ и

закрытым, не допускающим самопроизвольного изменения и развития языком компьютера,

― несоответствие между эквивалентностной природой языка компьютера и толерантностью лингвистических множеств,

― противоречие между единственным для компьютера смыслом тек

ста и его многоаспектностью естественно-речевого сообщения, несущего

― обычно три типа смыслов, из которых два диктуются прагматикой коммуникантов, а третий является независимым от них социологизо-ванным, коллективным смыслом.

Описанный барьер отторжения особенно отчетливо проявляется при семантико-синтаксическом анализе текста, а также при распознавании устной речи. (Что касается рутинных операций типа составления алфавитных, частотных или обратных списков, то здесь вполне оправдывает себя логическое исчисление).

Пренебрежение этими различиями и парадоксами неизменно заводит в тупик всех разработчиков систем АПТ и машинного перевода (МП), работающих в русле номотетической стратегии. Поэтому при-ходится искать новые теоретические решения, а на их основе разра-батывать такие технологические процедуры, которые могли бы ослабить отторжение ЕЯ со стороны компьютерного языка-исчисления. Эти под-ходы и процедуры опираются как на номотетическое, так и на идео-графическое изучение порождения и восприятия устной и письменной речи, а также на анализ ее информационно-статистических свойств.

Целостность, самодостаточность и саморегуляция всей речемысли-тельной деятельности отдельного человека и лингвистики социума, как и любой другой сложной динамической системы, обеспечиваются четырьмя терминальными элементами:

― статической парадигматикой з н а н и й;

― динамической и н ф о р м а ц и е й;

― статической (синхронной) п а р а д и г м а т и к о й материальных форм (т.е. звукотипов, морфем, слов и т.д.);

― динамической с и н т а г м а т и к о й (т.е. комбинаторикой) этих форм.

Эти элементы попарно связаны двумя измерениями-дихотомиями: содержание ― форма и статика ― динамика.

Представленный в книге лингвистический, психо- и инженерно-лингвистический, а также лингводидактический материал анализируется исходя из названных терминальных элементов и их связей. Но прежде чем приступить к его анализу этого материала необходимо сказать об особенностях современного подхода к изучению лингвистических объектов и процессов.

Часть I. РЕЧЕМЫСЛИТЕЛЬНЫЕ ОСНОВЫ ИНЖЕНЕРНОЙ ЛИНГВИСТИКИ И ЛИНГВОДИДАКТИКИ

Глава 1. ПРИНЦИПЫ АНАЛИЗА И МОДЕЛИРОВАНИЯ ЛИНГВИСТИЧЕСКИХ ОБЪЕКТОВ И ПРОЦЕССОВ *)

1.0. Вводные замечания: системно-синергетическая парадигма современного языкознания.

Выше уж говорилось о том, что языкознание меняет свою парадигму. Одной из примет новой парадигмы является поиск скрытых от прямого наблюдения механизмов самоорганизации и саморазвития систем языка и речи. Этот поиск опирается на фундаментальное представление о языке как об открытой саморазвивающейся не узуальной "мягкой" системе.

Основным приёмом исследования является здесь метод моделей и гипотез, сочетающийся с широким набором опытов различной природы, опирающихся на общую для экспериментальных наук схему. Рассмотрим каждую из этих черт новой лингвистической парадигмы в отдельности.

Современная наука чаще всего имеет дело с не наблюдаемыми прямо объектами и их совокупностями. Причиной этой ненаблюдаемости являются, обычно, внутренние свойства изучаемого объекта и ограниченные способности наших органов чувств и мозга. Например, многие объекты нельзя наблюдать из-за их слишком малой (ср. строение вещества на атомном уровне) или слишком большой (ср построение вселенной) размерности. Что касается сложных лингвистических явлений, то их невозможно прямо наблюдать из-за нерасчленимости или отсутствия прямой выраженности. Так, процесс анализа и синтеза текста в мозгу человека прямо наблюдать невозможно. Это сразу же привело бы к нарушению целостности мозга. Нельзя проследить и за тем, как происходит формирование слова из сем, поскольку последние не имеют

такой формы выражения, которая воспринималась бы нашими органами чувств. Во всех этих случаях приходится отказываться от попыток п р я-

м о г о н а б л ю д е н и я над объектом и применять другие, более изоще-ренные косвенные приемы исследования. Среди них наиболее распро-страненным является м е т о д м о д е л е й (м о д е л и р о в а н и е). Суть этого приема, опирающегося на номотетическую установку, состоит в том, что наблюдению и исследованию подвергается не сам н а т у р н ы й о б ъ е к т (или иначе о р и г и н а л), но его аналог-заместитель ― м о д е л ь.

Моделирование является основным приёмом, которым пользуется современная теоретическая и прикладная лингвистика, а также лингводидактика. Поэтому рассмотрим главные виды моделей, а также свойства и правила их построения и применения

_____________________________________________________

*) В этой главе суммируется содержание следующих работ автора: «Компьютеризация преподавания языков» (Л.: ЛГПИ им. А.И.Герцена, 1988); «Доказательно-экспериментальная парадигма соременного языкоз- нания»// Актуальные проблемы теоретической и прикладной лингвистики и оптимизация преподавания иностранных языков. Материалы Всероссийской научной конференции с международным участием. Тольятти: ТГУ, 2007

Модель и оригинал. Общие принципы построения моделей

В науке на понятие 'модель' не накладывается особых ограничений с точки зрения тех свойств, которыми обладает изучаемый с помощью модели оригинал. Модели могут служить средством изучения и описания внутреннего строения оригинала (с т р у к т у р н ы е м.), его поведения (ф у н к ц и о н а л ь н ы е м.) и развития (д и н а м и ч е с к и е м.). В лингвистической и дидактической проблематике выделяются я з ы- к о в ы е и р е ч е в ы е, п о р о ж д а ю щ и е и с и н т е з и р у ю щ и е текст модели. Сами модели могут иметь различную природу. Так, в качестве аналога лингвистического или дидактического оригинала могут быть использованы:

– реально существующий объект: например, для проверки сложных систем анализа и синтеза текста в качестве аналога ЭВМ выступает человек, который, проверяя вручную работу учебного алгоритма, моделирует поведение автомата;

– искусственный материальный объект: например, с помощью электронного синтезатора речевых сигналов моделируется порождение звуков конкретного языка;

– идеальная математическая или логико-математическая конструкция (формула, граф-чертёж), моделирующая либо структуру какой-либо язы-ковой системы (например, морфологической), либо ее функционирование (ср. модели порождающей грамматики или грамматики зависимостей).

Основными вопросами теории лингвистического моделирования являются:

1) эпистемологические (т.е. познавательные) аспекты моделирования;

2) вопросы онтологического (т. е. природного) сходства модели и оригинала в связи с задачей проверки её полезности.

1.1.1. Эпистемологические аспекты моделирования. Метод моделей подчинён номотетической познавательной установке, ориентированной на обобщение и классификацию отдельных фактов с целью обнаружения общего закона, которому подчиняются эти факты. Такая установка проявляется в следующих правилах выбора, построения модели и анализа результатов моделирования.

1. Модель выступает в качестве особого средства отображения объ-ективной действительности, которое осуществляется на основе анало-гии. Модель – это упрощённый аналог, но ни в коем случае не копия изу-

чаемого или представляемого объекта.

Рассмотрим в этой связи модели, отражающие соотношения рус-ских взрывных губных согласных. В первом случае это соотношение представлено в виде куба (рис. 1а), во втором – в форме бинарного дре-весного графа (рис. 1б) , описывающего эту систему. В вершинах куба и графа расположены фонемы, а их рёбра (грани) представляют различи-тельные признаки. Естественно речь идет здесь не о копиях той реальной записи фонологического фрагмента, который хранится в лингвистической памяти носителя языка, но о его геометрическом аналоге.

2. Модель не может быть сложнее самого оригинала, который

естественно не должен быть слишком примитивным. Одновременно применение конкретной модели должно быть более экономным по сравнению с другими приемами исследования оригинала. Эти требования формально выглядят следующим образом.

Имеется множество А, представляющее натурный объект и суще-ствует несколько методов нахождения a в А. Моделирование целесо-образно применить тогда, когда можно найти другое множество M = {m}, выступающее в роли модели, элементы которого могут быть приведены в соответствие с элементами множества М таким образом, чтобы элементы m в М, соответствующие a в А, можно было распознать с помощью некоторых к о ф ф и ц е н т о в п о д об и я. Тогда в М ищется элемент m, и если он найден, то обратное соответствие m ® a указывает решение в А. Чтобы применение метода моделей имело смысл, поиски в М должны проходить настолько быстрее, чем поиски в А, чтобы время затраченное на такие три операции, как

– переход от А к М,

– поиски m в M,

– обратный переход от m к a,

было меньше, чем время, затрачиваемое на поиски a непосредственно в А. При наличии нескольких корректных моделей наилучшей будет та, в которой все три операции осуществляются быстрее всего.

3. Построение модели должно быть свободным от противоречий (т. е. логически корректным), исчерпывающим и предельно простым. Требование корректности важнее требования исчерпывающего описания и критерия простоты. Критерий исчерпывающего описания более существен, чем требование простоты. Если удалось построить несколько одинаково корректных, исчерпывающих и простых моделей для данного натурного объекта, то наилучшей будет та, в которой все три операции, указанные в п. 2, осуществляются быстрее всего.

4. Модель должна иметь общий характер, позволяющий применять ее для описания различных натурных объектов. Например, машинную модель учебного англо-русского словаря целесообразно построить так, чтобы в будущем ее можно было применять для моделирования соотношения лексики других пар языков, например, немецко- или французско-русского.

5. Модель должна иметь объяснительную силу (экспланаторнсть), суть которой заключается в её способности объяснять и предсказывать нераскрытые до сих пор свойства натурного объекта.

Так, из анализа стереометрической и древесной моделей русских взрывных губных согласных (рис. 1) становится ясным, почему, с одной стороны, в конце русского слова, являющемся слабой фонетической и фонологической позицией, сохраняются такие противопоставления, как [f': s', m : p, m : p'] и т.п., – ср. бровь : брось, сам : сап, том : топь, а также [f : f', m : m', p : p'], – ср. кров : кровь, эконом : экономь, цеп :цепь, а с другой – нейтрализуется противопоставление пар [b : p, b': p', v : f] и т.п., - ср. серб : серп ® [s'erP]; зыбь : сыпь® з[yP'] : с[yP'], грив : гриф ® [gr'iF]. Дело в том, что нейтрализации на конце слова подвергаются те фонемы, которые противопоставлены по одному, наиболее слабому для русского языка различительному признаку [звонкость : глухость ]. Именно поэтому этот признак помещен в нижнюю часть древесной модели. Фонемы, противопоставленные по другим при-знакам или по двум и более различительным признакам, одним из которых может быть также признак [звонкость : глухость] , нейтрализации не подлежат.

6. Модель должна содержать в себе эвристические возможности, т.е. давать знания, которые сами становятся источником обнаружения новых фактов, а затем и отправной точкой для построения новых теорий и идей. Так, например, сведения, полученные при анализе древесной модели русских взрывных согласных могут быть использованы для выяснения фонемной природы заднеязычных звуков [g] и [g] в соотношении с их глухими коррелатами [k], [h]. Подавляющее большинство фонологов счи-тает [g] и [g] вариантами одной заднеязычной звонкой фонемы. Однако остается неясным, о какой фонеме здесь идет речь, о взрывном /g/ или фрикативном /g/. Ведь если в литературной норме, а также в большинстве северно-русских говоров эта фонема выступает как [g], то в южнорусском городском просторечьи и в ряде южно-, западно- и даже отдельных северно-русских говоров она реализуется в виде [g]. Решить эту задачу помогает наша модель, согласно которой нейтрализации в конце слова подвергается только одномерное противопоставление [глухость - звонкость]. Рассмотрим в этой связи две минимальные пары мог : мок и мог : мох. В петербургской литературной произносительной норме и в большинстве северных говоров нейтрализа-ции подвергается первая пара, дающая омофон [moK], при сохранении оппозиции [moK : moh]. Иными словами [g], находясь в одномерном противопоставлении с [k], репрезентирует здесь фонему /g/, a не /g/. Напротив, в говорах второй группы, а также в московском литературномпроизношении нейтрализацию дает вторая минимальная пара, выступа-ющая в разговорной речи в виде омофона [moH]. Первая пара сохраня-ется в форме оппозиции [moH : mok]. Иными словами, звук [g] предс-тавляет здесь фонему /g/, находящуюся в одномерном, устраняемом со-отношении [звонкий – глухой] с фонемой /h/. Т. о. экспланаторная сила рассматриваемой модели проявляется в том, что она помогает выявить не обнаруженные до сих пор различия в консонантных системах разных

(a)

носовые /m/ ●

неносовые

/b/ /p/

твёрдые

/m'/

●

мягкие

/b'/ /p'/

звонкие глухие

(b)

взрывные губные согласные

твёрдые мягкие

носовые неносовые носовые неносовые

звонкий глухой звонкий глухой звонкий глухой звонкий глухой

/m/ ● /b/ /p/ m'/ ● /b'/ /p'/

Рис. 1. Модели русских взрывных губных согласных

(а) -стереометрическая, (b) -древесная

Чёрным кружком отмечены "пустые" фонемные позиции

литературных стандартов современного русского языка.

1.1.2. Онтологическая состоятельность лингвистической модели. Для того чтобы модель стала эффективным средством познания и подчинения внешнего мира, она не может оставаться фиктивной, ис-кусственно созданной конструкцией, которая представляет собой просто красивую схему, построенную из таких привнесенных извне конструктов, которые не отражают или слабо отражают существенные черты натурного объекта. Модель должна быть онтологически состоятельна, т.е. анало-гична по своей внутренней сути оригиналу. Для её создания необходимо, чтобы при построении выполнялись следующие требования.

1. Модель должна отражать и воспроизводить те существенные черты натурного объекта, которые являются наиболее важными для дан-ного эксперимента. При этом побочные, не релевантные с точки зрения этого опыта свойства оригинала могут не учитываться моделью. Так, час-тотный словарь, в котором лексические единицы (ЛE) расположены в по-рядке убывания частоты их употребления, моделирует существенное для лингводидактики, психолингвистики, лингвостатистики и стилистики рас-пределение вероятностей ЛЕ и грамматических форм и конструкций в ис-следуемом языке. Однако такой словарь не учитывает ни семантических, ни синтаксических валентностей этих ЛE, которые в условиях статисти-ческого эксперимента рассматриваются в качестве побочных свойств ЛЕ.

2. Структура модели должна быть хорошо известна исследователю, а об оригинале должен иметься минимум таких сведений, которые позволяют предполагать, что элементы и их отношения в оригинале, с одной стороны, и элементы и их связи в модели, с другой, находятся в поддающемся контролю отношении полного (и з о м о р ф н о г о) или частичного (г о м о м о р ф н о г о) подобия. На основе этих сведений строится процедура переноса на оригинал той информации, которая была получена в результате наблюдений над построением и работой модели.

Если эти условия выполнены, то можно приступить к проверке онтологической состоятельности модели, а также ее непротиворечиво-сти, полноты, простоты, объяснительной силы и эвристичности. Эту про-верку можно осуществить двумя способами:

― попытаться обнаружить реально существующие объекты, отношения или процессы, которые нам были неизвестны, но существование которых как бы предсказывалось структурой и поведением модели,

― воспроизвести с помощью модели такие искусственные объекты, которые по своим онтологическим свойствам идентичны естественным объектам, порождаемым промоделированным оригиналом. Первый способ проверки используется в традиционных г и п о т е т и ч е с к и х моделях, второй применим к моделям в о с п р о и з в о д я щ и м.

Общая схема моделирования

Упрощённая схема построения и функционирования моделей показана на рис. 2.

Натурный лингвистический

1 объект (оригинал или

прототип)

Проверка состоятельности и онтологической

пригодности модели путем доказательно-экс-

периментального выявления и оценки близости

2 Вербальная гипотеза, порождаемых ею лингвистических объектов

инсайт (озарение) с объектами естественного языка и речи

Теоретический аналог

3 натурного объекта (мо-

дель на искусственном -

языке)

4 Воспроизведение моделисравнение модели с оригиналом

через изучения речевой деятель-

ности испытуемых с помощью

других лингвистических опытов, - .

либо коррекция гипотезы и

модели по обратной связи при

помощи ЛА

Рис. 2. Схема построения и функционированиялингвистическоймодели, сопряженной с ЛА

Общая схема моделирования

Упрощённая схема построения и функционирования моделей показана на рис. 2. Начнём с того, что прокомментируем наиболее важные для понимания сущности моделирования особенности построения и функционирования отдельных блоков схемы.