Лекция 6. Использование методов факторного анализа и многомерного шкалирования для выявления первичных (базисных) способностей
Нагруженность одного теста многими факторами является принципиальной особенностью всех практически применяемых тестов и всех моделей многофакторной теории интеллектуальных способностей. Это, с одной стороны, делает теорию более адекватной практическим задачам и реально существующим ситуациям, но с другой - сильно усложняет задачу интерпретации результатов измерения выраженности интеллектуальных способностей. Ясно, что описанные в предыдущем разделе факторы могут рассматриваться и как первичные, и как производные. Действительно, фактор вербального понимания может быть определен через факторы памяти, ассоциативного мышления, индуктивности; числовой фактор - через факторы памяти, пространственно-схематической ориентации, вербального понимания. Подобная картина имеет место и при рассмотрении других факторов.
Таким образом, выявление первичных (базисных) интеллектуальных способностей представляет собой сложную задачу Причем при решении этой задачи естественно появляется возможность "сжатия" информации. Это делает результат тестирования более обозримым, более удобным для интерпретации.
Одним из наиболее эффективных и применяемых сегодня средств "сжатия" информации является комплекс методов факторного анализа. В основе множества моделей современного факторного анализа лежит одна обшая идея, которая, как показала практика обработки больших массивов эмпирических данных, является действенной в самых различных областях человеческой деятельности - психологии, медицине, экономике, социологии (6: 72-80].
^гу идею составляет предположение о возможности выявления малого числа существенных, базисных параметров на основании анализа большого количества "внешних", "косвенных" измерений. При этом, как правило, оказывается, что многие из измеряемых в эксперименте параметров являются сильно коррелирующими друге другом. С другой стороны, "внутренние", существенные параметры часто являются трудно измеримыми и могут быть вычислены только на основании анализа массивов измеряемых параметров (рис. 5.7).
В процессе психологического тестирования измеряемыми параметрами являются реакции испытуемых. "Внутренние", сущест-
венные параметры, которые выявляются в процессе анализа результатов тестирования, в факторном анализе обозначаются как факторы. В качестве примеров таких факторов могут быть названы уровень математических или художественных способностей, тип темперамента, уровень мотиваций и т.д.
В общем случае удобно представить, что в результате применения некоторого количества различных тестов (п) на некоторой совокупности испытуемых (ЛО мы получаем массив данных, матрицу 2 = (И х п). Пусть строки этой экспериментальной матрицы соответствуют различным наблюдаемым объектам (т.е. испытуемым), а столбцы - параметрам, опи
сываюшим состояние объектов (т.е. реакции испытуемых на тесты), - таблица 5.2. В такой матрице каждый элемент ^указывает значение, которое принимаету-й параметр на i-м объекте, то есть результат, который показывает /-й испытуемый в результате применения у-го теста.
Существенно отметить, что столбцы матрицы, являясь результатами применения тех или других тестов, имеют, вообще говоря, различный смысл. Ввиду этого, как правило, матрицу данных (Z) приводят к стандартизированному виду (матрице X), что связано с переходом к стандартной нормированной шкале измерений.
Отметим также, что возможны две геометрические интерпретации матрицы исходных данных. По одной можно рассматривать yV-мерное пространство, оси которого соответствуют отдельным параметрам или факторам. Каждая строка при этом имеет смысл вектора в пространстве параметров. При этой интерпретации мы имеем возможность сравнивать близость реакций всех испытуемых в пространстве N параметров.
По другой интерпретации можно рассматривать ^-мерное пространство, оси которого соответствуют отдельным объектам (испытуемым). В таком пространстве объектов каждый параметр (т.е. тест) представляется вектором. Это пространство является пространством объектов и удобно в связи с тем, что в нем имеется возможность сравнения близости отдельных тестов в "пространстве испытуемых".
Та б л и и а 5.2. Структура матрицы экспериментальных данных
Важным шагом в моделях и методах факторного анализа является переход от стандартизированной матрицы данных X размерности N хпк квадратной корреляционной матрице размерности
пхп. Элементы матрицы Я представляют собой коэффициенты корреляции г@,к) между соответствующими параметрами (результатами тестирования) х! и хк.
где х1 х1 - векторы, обозначающие у" и Л столбцы матрицы X.
Факт близости коэффициента корреляции к 1 говорито малом отличии значений параметров в среднем на различных объектах, что не исключает, конечно, того, что значения параметров на некоторых объектах могут отличаться значительно. Факт близости величины к 0 говорит, в свою очередь, о малой связи параметров и о малой предсказуемости значений одного параметра исходя из величин другого. Вообще, чем меньше величина I г {],к) (абсолютное значение коэффициента корреляции), тем меньше связаны параметры х1 хк (т.е. соответствующие тесты) между собой и, следовательно, тем в меньшей степени можно предсказать по результатам тестирования одним тестом результаты тестирования другим.
В свете сказанного основная идея факторного анализа может быть сформулирована следующим образом. Решение задачи сжатия информации при переходе от большого количества поддающихся измерению параметров к существенно меньшему количеству "скрытых" базисных параметров-факторов сводится к нахождению небольшого количества векторов с N компонентами (где N - число строк матрицы данных). Другими словами, решение задачи означает приписывание кисходной матрице небольшого числа новых столбцов, с помощью которых можно хорошо описать все столбцы исходной матрицы. Входе этой процедуры, естественно, происходит снижение размерности уУ-мерного пространства параметров.
Какова же связь между измеряемыми в эксперименте параметрами и факторами? Другими словами, какова связь между измеряемыми функциями и их"глубинными"аргументами. Вфакторном анализе, как правило, эта связь предполагается линейной:
где х - измеряемые параметры, число которых равной; аХу. - коэффициенты, подлежащие определению и определяющие нагруз-куу-го параметра наЛ-й фактор (факторные нагрузки);/* - общие факторы, определяющие базис и участвующие, таким образом, в представлении всех параметров измерения, причем число факторов т всегда меньше, чем п (т< п). Ъ,' - "характерные" факторы, каждый из которых участвует в определении только одного, своего, параметра. Характерные факторы имеют смысл помехи.
Заметим, что предположение линейности связи между измеряемыми параметрами и "глубинными" базисными факторами является существенным. Как правило, в факторном анализе обшие факторы являются ортогональными. В любой модели факторного анализа цель работы заключается в определении обших факторов и факторных нагрузок, причем геометрически факторные нагрузки являются проекциями параметров на соответствующие общие базисные факторы.
Важно отметить, что в рамках факторного анализа отсутствует однозначное определение набора общих (базисных) факторов, удовлетворяющих данному эмпирическому материалу. В общем случае общие факторы определяются косвенным образом. Вначале непосредственно вычисляются факторные нагрузки, затем ищутся такие линейные комбинации измеряемых параметров, которые в каком-либо смысле являются "хорошими" оценками общих факторов.
Исходя из сказанного, актуальной является задача выбора из множества наборов общих факторов некоторого набора, удоат.ет-воряюшего целям исследования и интуиции исследователя. Переход от одного набора ортогональных обших факторов (одного базиса) к другому можно представить геометрически как процесс "вращения" первоначального базиса. В результате этой процедуры, естественно, изменяются величины факторных нагрузок, то есть величины проекций результатов тестирования на оси базисных факторов (рис. 5.8).
Близкими к методам факторного анализа являются методы многомерного шкалирования. Основой этих методов вприменении к рассматриваемым нами задачам также является цель понижения размерности пространства измеряемых параметров и выделения "первичных" интеллектуальных способностей. Главное отличие метода заключается в том, что при многомерном шкалировании вместо корреляционной матрицы используется матрица сходства объектов. Процедура составления такой матрицы заключается в том, что испытуемый интуитивно оценивает степень различия (сходства) между теми или иными объектами. При этом считается, что в своих суждениях человек неявно использует базисные признаки.
Например, при сравнении множества людей по их способности к решению задач может быть получена матрица близости, на основании анализа которой появляется возможность выявления факторов интеллекта. Другой пример - выявление степени различия (сходства) между разными типами животных и птиц. Испытуемые на основании своих интуитивных правил оценивают попарное сходство между исходными объектами. В итоге в результате формирования матрицы сходства становится возможным, как и в первом случае, ввести некоторую метрику, количественно описывающую близость исходных объектов. Причем такая метрика будет описывать близость между объектами в некотором многомерном пространстве, в котором исходные объекты будут представлены точками, расстояния между которыми определяются в соответствии со степенью их интуитивной близости.
Рассмотрим несколько подробнее процедуру построения такого пространства и процедуру выделения на нем отдельных факторов или шкал. Допустим, имеется матрица сходства между Лоточками. Возьмем любые три из N и проверим, лежат ли они на одной прямой, то есть, другими словами, могут ли они быть объединены одним фактором (осью, шкалой).
Идея проверки заключается в проведении через две точки (А и В) оси и измерении расстояний АВ, АС и СВ. Если при этом АВ = АС +СВ, тоточкаСлежитнаоси,еслиЛЯ < АС + С5,тонет. В этом случае можно оценить величину перпендикуляра САГ от С до оси и, если СК больше некоторого порогового значения, ввести вторую ось, ортогональную первой (рис. 5.9). Введение последующих осей-факторов проводится аналогичным образом путем перебора точек из N. Расчетные процедуры при этом, естественно, усложняются, а степень наглядности уменьшается.
Приведенная процедура, несмотря на упрощенность и неуниверсальность, ясно показывает, про крайней мере, одну существенную особенность анализа - необходимость проведения смысловой интерпретации полученных осей или факторов. Действительно, пусть в результате работы мы смогли описать множество тестов в двухфакторном пространстве каклинейные комбинации этих факторов. Однако процедура факторного анализа (или равно многомерного шкалирования) ничего не говорит нам о том, чем являются выделенные оси (рис. 5.10).
Предположим, что в рассмотренном выше примере с животными разных типов все точки, то есть все объекты сравнения, удалось расположить на плоскости. Таким образом, в результате проведенной процедуры исходное неопределенно большое количество параметров, на основании которых люди обычно описывают животных, удалось свести к двум гипотетическим базисным факторам (любая точка плоскости описывается в пространстве двух осей - х, у). Однако теперь возникает вопрос о том, как интерпретировать содержательный смысл оси х и оси у? В данном примере ось х может, например, иметь смысл размера животного, а ось .у - смысл длины передних конечностей.
На рис. 5.11 приведен пример, в котором ось у может иметь смысл "домашние животные - дикие животные" (за исключением "кошки"). Кроме этого, в пространстве птиц (рис. 5.11, а) ось л; может иметь смысл "птицы - красивые птицы".
Р и с. 5.11. Результаты процедуры многомерного шкалирования. Выявление базисных факторов, определяющих принципы установления близости между понятиями участковсемантической памяти:
А - определение близости (степени сходства) между понятиями класса "птицы"; Б - определение близости (степени сходства) между понятиями класса "животные" (по 29:186)
Этап интерпретации совершенно автономен и требует психологической интуиции. Дело в том, что существует множество разных ортогональных базисов обших факторов одной и той же размерности. Переход от одного набора обших факторов к другому геометрически в этом случае выглядит как "вращение" первоначального набора. При этом для определения "истинного" базиса необходимо проведение содержательного анализа групп измеряемых параметров, имеющих сильную корреляцию (или степень сходства). Отметим, что весьма естественной является ситуация, в которой в принципе удобно ввести неортогональные, тоесть взаимозависимые, оси, так как именно при этом оси приобретают однозначную, осмысленную интерпретацию.
Можно предположить, что в рассматриваемом примере поворот осей на определенный угол или же введение каких-то двух не-перпендикулярньгх (неортогональных) осей даст возможность провести новую, более хорошую интерпретацию смысла этих осей.
Подводя итог рассмотрения методов факторного анализа и многомерного шкалирования, заметим, что сущность этих методов сжатия информации заключается в выявлении скрытых корреляционных отношений между различными измеряемыми параметрами. Другими словами, в выявлении таких измерений, результаты которых могут быть хорошо предсказуем ы на основании других измерений. Таким образом, происходит выявление тесно связанных групп измерений, что и является основой эффекта понижения размерности массивов изучаемых параметров. Однако такие процедуры в лучшем случае только подготавливают почву для выявления действительно глубинных базисных компонент, лежащих в основе формирования различных групп интеллектуальных и творческих способностей.
Выявление корреляционных отношений само по себе автоматически не обеспечивает обнаружение причин, лежащих в основе формирования отдельных групп сильно связанных параметров. И это, по-видимому, является принципиальным ограничением возможностей данных методов. Возможно, дальнейшее продвижение к цели выявления базисных характеристик, определяющих способности человека, связано с изучением психофизиологических закономерностей осуществления тех или иных тестовых функций.