Лекция 17. МОДЕЛИРОВАНИЕ И ОПРЕДЕЛЕНИЕ СВЯЗЕЙ МЕЖДУ ПЕРЕМЕННЫМИ

Моделирование, как эксперимент и наблюдение, относится к базовым методам научного исследования. Сущность метода моделирования заключается в построении моделей изучаемых феноменов, которое позволяет не только добиться высокой степени понимания реальности, но и — в ряде случаев — делать точные количественные предсказания относительно будущего развития изучаемых феноменов. Таким образом, моделирование позволяет решать фундаментальные задачи науки — задачу выявления связей между переменными, а также задачи прогнозирования и управления.

Краеугольным понятием метода моделирования является понятие модели.

Модель — это конструируемый объект (физический или идеальный), который воспроизводит некоторые свойства другого объекта, являющегося собственно предметом изучения.

Моделирование заключается в построении и последующем изучении модели, которое замещает непосредственное изучение исходного объекта. Выводы, полученные на основе изучения модели, переносятся на исходный объект, причем возможность такого переноса обосновывается сходством модели и исходного объекта. Очевидно, что речь идет об умозаключении по аналогии, не имеющем, строго говоря, логического обоснования. Поэтому возможность продуктивного использования метода моделирования зависит, прежде всего от качества используемых моделей. Хорошая модель должна быть максимально упрощена, но вместе с тем отражать основные, существенные свойства исходного объекта.

Ценность моделирования заключается в том, что оно позволяет делать выводы об изучаемых феноменах в тех случаях, когда их непосредственное изучение невозможно. Например, изучение когнитивных нарушений в условиях экстремального стресса целесообразно проводить на основе моделей, описывающих взаимодействие когнитивной и эмоциональной сфер, не подвергая реальных испытуемых риску повышенной эмоциональной нагрузки. Создание научных моделей имеет, однако, самостоятельный гносеологический смысл, так как является, наряду с другими эмпирическими методами, эффективным средством проверки научных теорий. Современные научные модели в явной форме эксплицируют отношения между теоретическими конструктами, и успешная проверка таких моделей означает увеличение степени правдоподобности стоящих за ними научных теорий.

Процесс создания любой модели является итеративным и заключается в чередовании этапов построения, настройки (или подгонки) и верификации модели. Должным образом верифицированная модель может быть использована для решения фундаментальных и прикладных задач.

Построение модели заключается в ее описании с использованием какого-либо языка (естественного или — чаще -формального). Научные модели могут принимать самый разный вид — от качественных, описывающих концептуальные отношения между представляющими интерес сущностями, до количественных, описывающих точные количественные отношения внутри системы переменных в виде набора уравнений (именно этот класс моделей особенно полезен для решения задач управления и прогнозирования). Для построения модели критически важной является формулировка допущений. По сути, допущения представляют собой решения об идеализации реальности, которая позволяет разработчику модели сформулировать достаточно простую, но в то же время информативную модель (например, при построении психологической модели исследователь часто принимает решение игнорировать нелинейные отношения между входящими в модель переменными). В целом построение модели часто является индуктивным и даже интуитивным процессом — и в этом отношении во многом аналогичным этапу выдвижения гипотезы в рамках гипотетико-дедуктивного метода.

Подавляющее число моделей допускают возможность дополнительной "настройки". Это, в частности, необходимо при моделировании индивидуальных различий в психических процессах. Такая гибкость достигается за счет включения в модель параметров, т.е. величин, изменение значений которых влияет на поведение модели. Например, модели категоризации, описывающие отнесение стимулов к различным семантическим категориям на основе анализа их перцептивных признаков, часто содержат параметры, характеризующие степень субъективной значимости того или иного признака для определенного испытуемого. Конкретные значения параметров обычно достаточно трудно определить a priori, и поэтому на этапе подгонки используются различные методы определения оптимальных значений параметров. Значения параметров считаются оптимальными, если позволяют максимально приблизить поведение модели к поведению моделируемого объекта. Введение параметров в модель должно быть содержательно обосновано, так как бесконечное увеличение числа параметров позволяет подогнать любую модель под любой набор эмпирических данных.

После построения модели необходимо доказать ее соответствие изучаемому феномену (этап верификации). Проверка моделей осуществляется на основе оценки способности модели демонстрировать предсказанное поведение при создании определенных условий. Для этого исследователю необходимо собрать данные о поведении исходного объекта в этих условиях, а также о поведении модели в аналогичных условиях (при этом используются значения параметров, определенные на этапе подгонки модели). Например, при верификации моделей категоризации необходимо собрать данные о результатах категоризации набора элементов испытуемыми людьми, а затем — данные о результатах категоризации того же набора стимулов тестируемой моделью. Имея эти два набора данных ("эмпирический" и "теоретический"), исследователь получает возможность качественно или количественно оценить степень их сходства. Если поведение испытуемых и модели является сходным, то модель может рассматриваться как прошедшая проверку. Если же поведение модели значительно отличается от поведения исходного объекта, то модель должна быть отвергнута как несостоятельная.

Количественная оценка степени соответствия между эмпирическим и теоретическим набором данных осуществляется с помощью так называемых индексов соответствия (Jit indexes). Индексы соответствия представляют собой численные показатели, анализ значений которых позволяет сделать вывод о степени "близости" двух наборов данных. Выбор конкретного индекса соответствия в той или иной ситуации моделирования зависит от множества условий, таких как метрика и особенности распределения использованных переменных. Для некоторых индексов существует возможность получить статистическую оценку значимости степени соответствия модели и моделируемого объекта. Для других индексов данный аналитический аппарат недоступен, и решение о степени соответствия принимается на основе качественных рекомендаций, содержащихся в специальной литературе. В целом следует отметить, что иногда однозначный выбор "оптимального" индекса соответствия невозможен и разработчик модели должен принимать взвешенное решение, руководствуясь значениями нескольких индексов соответствия одновременно.

Таким образом, в результате проверки принимается решение о принятии модели или ее отвержении. Прохождение эмпирической проверки не означает "истинности" модели. Принятие модели говорит о том, что модель может использоваться вплоть до обнаружения существенных недостатков. С другой стороны, если модель не прошла эмпирической проверки, это означает ее неспособность достоверно описывать изучаемый феномен. Такая модель не может быть использована в исследовательских или прикладных целях. На практике отвержение модели чаще всего означает необходимость ее модификации (изменения допущений, модельных отношений, количества параметров), после чего модель, возможно, верифицируется повторно. Таким образом, логика проверки моделей обнаруживает тут же асимметрию вывода, что и проверка гипотез в экспериментальном методе.

Сходство экспериментального метода и метода моделирования не является случайным, так как оба метода следуют одной гипотетико-дедуктивной логике. Моделирование может пониматься как экспериментирование над моделями. В самом общем смысле модель представляет собой систему утверждений о связях между переменными, и на этапе проверки исследователь оценивает соответствие утверждений ("предсказаний") модели наблюдаемым связям между переменными (информация о которых получена путем обследования моделируемого объекта). Точно так же в эксперименте исследователь оценивает соответствие гипотезы (утверждения о связях между переменными) эмпирической реальности (реальным, наблюдаемым связям между переменными), осуществляя контролируемые воздействия на объект исследования. Таким образом, и в том, и в другом случае исследователь оценивает истинность теоретического утверждения на основе анализа эмпирических данных. Логическим основанием такой проверки в обоих случаях является силлогизм modus tollens. Однако моделирование как метод обладает тем существенным преимуществом, что, используя достаточно хорошо верифицированную модель, исследователь получает возможность устанавливать влияние различных опасных, экстремальных и других условий без фактического воздействия их на изучаемый объект.

В современной психологии используется так называемое знаковое моделирование, которое заключается в построении формальной модели психических процессов с использованием тех или иных символических систем. В первую очередь речь идет об использовании математической нотации, вследствие чего обычно используется термин "математическое моделирование". В узком смысле математическое моделирование использует модели, состоящие в описании характеристик описываемых объектов в виде уравнений. В последние десятилетия математическое моделирование является бурно развивающейся областью психологического моделирования, для которой характерны выраженная специализация и выработка специфических методических приемов. Так, в последние годы развитие получило динамическое моделирование, описывающие динамику сложных систем с помощью аппарата дифференциальных уравнений. Этот вид моделирования, идеально приспособленный для анализа процессов развития сложных систем, широко используется, например, в возрастной и социальной психологии. Другим видом математического моделирования является байесовское моделирование. Данный вид моделирования используется для построения количественных моделей когнитивных процессов, составным элементом которых является принятие решений (опознание, категоризация, овладение языком и т.д.). В основе моделирования процесса принятия решения лежит математический аппарат проверки гипотез на основе теоремы Байеса.

Особое значение для психологии имеют два варианта знакового моделирования: вычислительное моделирование и статистическое моделирование. Вычислительное моделирование заключается в построении формальной модели изучаемого феномена в виде исполняемой компьютерной программы. Это позволяет оцепить поведение сложных моделей в тех случаях, когда получить такую оценку аналитическим путем трудно (или даже невозможно) в силу их большой сложности. Кроме того, систематически изменяя вводные данные программы, можно осуществить так называемый вычислительный эксперимент, суть которого заключается в получении данных о поведении модели в различных условиях. Вычислительное моделирование особенно широко распространено в когнитивной психологии, что во многом обусловлено легкостью трансляции информационных моделей психических процессов в исполняемые компьютерные программы.

Статистическое моделирование представляет собой особый вид моделирования, который заключается в построении статистических моделей, дающих компактное описание набора эмпирических данных с незначительной потерей информации. В самом общем виде статистическая модель представляет собой уравнение, описывающее связи между одной или несколькими зависимыми переменными и одной или несколькими независимыми переменными. Такое уравнение не является детерминистическим и содержит случайный компонент, что позволяет описывать распределения зависимых переменных. Для психологии оно имеет особое значение в силу множественной детерминированности психологических переменных и выраженного вероятностного характера отношений между психологическими переменными. Конечной целью статистического моделирования в психологии является количественное описание связей между психологическими переменными, в частности причинно-следственных связей.

Как и любой вид моделирования, статистическое моделирование заключается в построении модели с ее последующей подгонкой и верификацией. Например, при построении линейной регрессионной модели исследователь должен указать зависимую переменную У (критерий) и одну или

несколько независимых переменных X; / = 1,...,и (предикторов). Модель предполагает, что значение критерия представляет собой линейную комбинацию значений предикторов:

При этом коэффициенты Ь. являются параметрами регрессионной модели. Каждый коэффициент может быть интерпретирован как частный коэффициент корреляции, описывающий силу линейной связи между критерием У и предиктором X. за вычетом влияния других предикторов. Содержательно о; определяет "вес", с которым предиктор Х-: участвует в определении значения критерия (например, легко видеть, что если Ь{ приближается к нулю, то влияние X. на У исчезает). Таким образом, анализируя параметры, исследователь получает возможность определить, какие предикторы существенны для определения значения критерия, а какие не оказывают на эту величину выраженного влияния. При соблюдении определенных условий (условия причинного вывода) существенные предикторы могут получить содержательную интерпретацию как причины, определяющие следствие У.

Простым примером линейной регрессионной модели является регрессия, связывающая успешность сдачи экзамена с рядом потенциальных предикторов. К последним относятся, например, частота посещения лекционных и семинарских занятий и среднее количество часов, выделяемых учащимся на подготовку к экзамену в течение семестра. Кроме того, возможное влияние на экзаменационную оценку оказывают факторы, не имеющие непосредственного отношения к интенсивности подготовки: физическое самочувствие обучающегося в день экзамена, индивидуальный уровень экзаменационной тревожности или даже опрятность одежды обучающегося и характерная для него манера изложения мыслей. Первостепенной задачей исследователя является определение набора потенциальных предикторов для включения в регрессионную модель, которые — согласно рациональному анализу или на основе уже имеющихся эмпирических результатов — могут быть связаны с критерием. Впоследствии на основе анализа регрессионных коэффициентов исследователь сможет отбросить часть предикторов, которые окажутся несущественными.

Для того чтобы предложенную регрессионную модель можно было использовать, необходимо определить значения ее параметров, т.е. значения регрессионных коэффициентов Ьг Это осуществляется на этапе подгонки модели, в ходе которого выбираются конкретные значения /?.. Для подгонки регрессионных моделей чаще всего используется так называемый метод наименьших квадратов (метод заключается в минимизации квадрата разности эмпирических значений критерия У- и предсказанных значений критерия Г.). После этого модель верифицируется с использованием того или иного индекса соответствия. В случае линейной регрессии таким индексом является коэффициент множественной детерминации К2, значение данного показателя равно проценту дисперсии (изменчивости) критерия, который может быть объяснен совокупным влиянием включенных в регрессионную модель предикторов. Высокие значения к2 говорят о высоком качестве модели, а низкие — о том, что предложенная модель является неудовлетворительной. Качество различных моделей М, и М2 (объясняющих один и тот же критерий) может сравниваться на основе сравнения их индексов соответствия Я2Х и г?2.,.

Построение компактной и информативной регрессионной модели является итеративным процессом, в ходе которого исследователь исключает из модели малоэффективные предикторы и дополняет ее другими потенциально важными предикторами. В ходе этой деятельности исследователь ориентируется на большое количество формальных и содержательных показателей. После того как исследователь сочтет регрессионную модель удовлетворительной, она может быть использована для содержательных выводов о связях между переменными модели и о психологических механизмах, лежащих в основе этих связей. Кроме того, хорошо верифицированные регрессионные модели могут быть использованы в практических целях для предсказания значения критерия на основе набора предикторов в тех случаях, когда непосредственное измерение критерия невозможно или затруднительно. Такая необходимость возникает, например, при необходимости осуществить прогноз эффективности профессиональной деятельности человека в будущем на основании анализа его психологических характеристик при поступлении на работу.

Линейные регрессионные модели являются наиболее распространенными статистическими моделями в современной психологии в силу их относительной простоты и разработанности математического аппарата. Тем не менее существует значительное количество более сложных видов статистических моделей, обладающих большим потенциалом точного описания психологических феноменов. Например, очевидным расширением линейных моделей являются нелинейные регрессионные модели, которые допускают наличие нелинейных связей между критерием и набором предикторов. Кроме того, линейные модели могут расширяться до многоуровневых (иерархических) моделей, описывающих влияние предикторов на критерий на нескольких уровнях агрегации данных (например, индивид группа общество). Другим актуальным направлением статистического моделирования в психологии является построение моделей с латентными переменными — ненаблюдаемыми факторами, которые представляют общую для нескольких наблюдаемых переменных дисперсию (подробнее они будут охарактеризованы в следующей главе о структурном моделировании). Объединение регрессионных моделей и моделей с латентными переменными используется при методе структурного моделирования, уже ставшего стандартным методом анализа многомерных данных в корреляционных и экспериментальных исследованиях.

Моделирование в различных его видах относится к стандартному арсеналу методов проведения современных психологических исследований. Возможность (и необходимость) формулирования в рамках применения метода моделирования точных количественных моделей изучаемых психологических феноменов и ориентация на объективную проверку предлагаемых моделей значительно ограничивает возможности спекулятивного теоретизирования для исследователей. Кроме того, развитый аппарат оценки качества моделей путем использования индексов соответствия не только снижает возможность субъективных искажений при принятии решения о результатах моделирующего исследования, но и открывает широкие возможности для объективного выбора лучшей модели из набора альтернативных моделей. В целом применение моделирования как метода психологического исследования в значительной мере способствовало и способствует превращению психологии в науку, способную к достоверному выявлению закономерных связей между теоретическими конструктами и эффективному использованию этих результатов для решения как фундаментальных, так и практических проблем.