ЛОКАЛИЗАЦИЯ ТОЧКИ НА ШКАЛЕ 13 страница

“Методы прямой оценки”

 

Задание 1. Построение психофизической функции высоты звукового тона

 

Цель задания. Практически ознакомиться с методом установления заданного отношения, построить психофизическую функцию высоты звукового тона.

 

Методика

Аппаратура. Задание выполняется на IBM-совместимом персональном компьютере. Для предъявления звуковых стимулов используются специальная звуковая плата типа “Sound Blaster” и головные телефоны. Для выполнения учебного задания используется компьютерная программа sscal.exe.

Стимуляция. Стимулами являются бинаурально предъявляемые тональные звуковые сигналы в диапазоне от 125 до 12000 Гц и интенсивностью около 80 дБ (УЗД). Используются 8 стандартных стимулов: 125, 250, 500, 1000, 2000, 4000, 6000, 8000 Гц.

Испытуемые. Каждый студент сначала работает как испытуемый, а затем обрабатывает свои оценки и строит по ним психофизическую зависимость. Для получения групповых данных испытуемые должны объединиться в группу не менее 7—10 человек.

Процедура. Шкалирование производится методом оценки заданного отношения в вариантах фракционирования (деления на 2) и мультипликации (умножения на 2). Опыт состоит из 2-х серий — “деление на 2” и “умножение на 2”. В первой серии используются 7 стандартных стимулов: частотой 250, 500, 1000, 2000, 4000, 6000 и 8000 Гц. Во второй — 125, 250, 500, 1000, 2000, 4000, 6000 Гц. Стандартные стимулы предъявляются в случайном порядке, каждый по 5 раз. Оценка заданного отношения производится методом установки, когда, регулируя частоту переменного стимула, испытуемый подбирает подходящий переменный стимул.

Каждая проба начинается с предъявления на экране монитора ее порядкового номера (от 1 до 35). После этого, нажав на клавишу <пробел> на клавиатуре компьютера, испытуемый должен прослушать звучание стандартного стимула. Для прекращения предъявления стандартного стимула следует нажать клавишу <Esc>. Регулировка частоты переменного стимула (от частоты стандарта) осуществляется клавишами управления движением курсора — <> , <> , для уменьшения и увеличения частоты, соответственно. Нажимая на эти клавиши, испытуемый может изменять частоту звукового сигнала: чем дольше нажимаешь на клавишу, тем быстрее меняется его частота. В любой момент испытуемый может вернуться к прослушиванию стандартного стимула, нажав еще раз на <пробел>. Окончание подбора переменного стимула, находящегося в заданном отношении к стандартному, подтверждается нажатием на клавишу <Enter>.

Между сериями устраивается 5-минутный перерыв.

Обработка результатов. После окончания опыта испытуемому выдается распечатка индивидуальных результатов, в которой для каждой серии (деление и умножение на 2) приводятся геометрические средние его оценок стандартных стимулов.

В ходе дальнейшей обработки индивидуальных результатов каждому студенту следует выполнить следующее:

1. Занести полученные данные в таблицу.

2. Представить полученные данные в линейных координатах на 2-х отдельных графиках (рис.1 и 2): абсцисса — частота стандартного стимула, ордината — частота стимула, оцененного находящимся в заданном отношении (1/2, 2) к стандартному.

4. То же самое повторить в двойных логарифмических координатах (рис. 3 и 4). С помощью линейного регрессионного анализа вычислить параметры регрессионных прямых для двух серий опыта и построить соответствующие прямые на рис. 3 и 4.

Для выполнения регрессионного анализа целесообразно воспользоваться статистическим пакетом “Stadia”. В редакторе данных частоты стандартного стимула заносятся в первую переменную (это будут значения X ), а оценки испытуемого — во вторую (это будут значения Y). Затем переходят в меню статистических процедур (F9) и выбирают опцию “Простая регрессия (тренд)”. Войдя в нее, нужно указать номера переменных (1, 2), а затем указать тип функции для построения регрессии — линейная. После этого программа построит для вас математическую модель ваших данных, представляя их в виде уравнения прямой: Y = a0 + a1*X. Получив коэффициенты a0и a1, можно без труда построить на графике аппроксимирующую прямую, проходящую через 7 экспериментальных точек. Статистическая оценка адекватности сделанной линейной аппроксимации приводится внизу экрана.

5. Построить психофизическую зависимость, используя результаты 2-х серий опыта — “деление на 2” и “умножение на 2”. Для этого поступим аналогично С. Стивенсу и соавт. (1937) и примем ощущение высоты тона 1000 Гц за точку отсчета, присвоив ей величину 1000 “мел”. Для нахождения необходимых значений на оси абсцисс психофизической функции можно воспользоваться либо графиками, построенными на рис. 3 и 4, либо решить ту же задачу более точно — аналитически.

С этой целью можно обратиться к уравнениям регрессионных прямых и проделать все вычисления по формуле вручную или еще раз воспользоваться программой “Stadia”. Формально это означает, что по полученному уравнению регрессионной прямой (геометрической модели оценок испытуемого) нужно найти неизвестные X по известным Y. Для проведения расчетов нужно снова вернуться в меню статистических методов и, выбрав ту же опцию (“Линейная регрессия”), указать другой порядок переменных — 2,1. Это будет означать , что в качестве X мы выбираем полученные оценки испытуемого, а в качестве Y — частоту стандарта. После расчета нового регрессионного уравнения можно найти все необходимые точки на оси X конструируемой психофизической функции.

Нанеся 8—10 точек на график психофизической функции можно попробовать соединить их плавной кривой и прикинуть “на глазок” вид полученной функции. Для более строгой оценки полученной зависимости следует вновь обратиться к статистической программе “Stadia” и, воспользовавшись методами регрессионного анализа, оценить ее как соответствующую логарифмической или степенной функции. Степень соответствия можно оценить по максимуму коэффициента корреляции и минимуму стандартного отклонения и доверительного интервала коэффициентов а0и а1.

6. Построить психофизическую функцию по групповым данным, для чего вычислить геометрические средние по 7—10 индивидуальным оценкам, причем в каждую группу не должны входить одинаковые индивидуальные данные.

Обсуждение результатов.

1. Сопоставив данные умножения и деления, оценить обоснованность полученной субъективной шкалы, как шкалы отношений.

2. Сделать вывод о приложимости одного из известных психофизических законов к полученным экспериментальным данным.

3. Сравнить индивидуальную и групповую шкалы и оценить их адекватность литературным данным (см. статью Р. Вудвортса и Г. Шлосберга в кн. “Проблемы и методы психофизики”. Под ред. А.Г. Асмолова, М.Б. Михалевской, с. 183-186).

 

 

ЧАСТЬ III

МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ

 

Глава 1. ФАКТОРНЫЙ АНАЛИЗ

 

Введение

 

Факторный анализ (ФА) принадлежит к числу таких методов, которые будучи разработанными в рамках запросов одной науки, впоследствии приобрели более широкое междисциплинарное значение. Заслугой психологии можно считать разработку именно такого метода. Исторически возникший в лоне психометрики, ФА в настоящее время приобрел статус общенаучного метода и широко распространен не только в психологии, но и в нейрофизиологии, социологии, политологии, экономике и статистике. Поэтому не стоит удивляться, если на вопрос к математику, что такое ФА, вы получите ответ, что этот метод понижения размерности корреляционной матрицы, а экономист добавит, что ФА используется им как средство визуализации многопараметрического объекта экономического анализа.

ФА как общенаучный метод, получивший к настоящему времени солидное математико-статистическое обоснование, имеет непростую историю, начиная с полного отказа математиков признать ценность используемого психологами в известной степени нестрогого и зависящего от мастерства исследователя алгоритма до обязательного включения различных вариантов ФА в любую сколько-нибудь известную компьютерную статистическую программу. Основные идеи ФА (впрочем, как и других методов многомерного анализа данных) были заложены в трудах известного английского психолога и антрополога Ф. Гальтона (1822—1911), основателя евгеники, внесшего также большой вклад в исследование индивидуальных различий. В разработку ФА внесли вклад многие ученые и только на русском языке опубликовано более 10 монографий, посвященных непосредственно ФА, однако психологи должны быть особенно признательны трем своим коллегам, с именами которых связаны разработка и внедрение ФА в психологию — это Ч. Спирмен (1904, 1927, 1946), Л. Терстоун (1935, 1947, 1951) и Р. Кеттел (1946, 1947, 1951). Кроме того, нельзя не упомянуть еще трех ученых — английского математика и философа К. Пирсона, в значительной степени развившего идеи Ф. Гальтона, американского математика Г. Хоттелинга, разработавшего современный вариант метода главных компонент, и известного английского психолога Г. Айзенка, широко использовавшего ФА для разработки психологической теории личности.

Необходимо отметить, что в силу профессиональных установок авторов в литературе на русском языке (К. Иберла, 1980; Г. Харман, 1972) ФА чаще всего излагается как один из методов математической статистики, а ориентированное на психологов изложение — скорее исключение, чем правило (Дж. Ким, Ч. Мьюллер, 1989; Я. Окунь, 1972). В данной главе ФА будет излагаться как один из методов психологического шкалирования и многомерного анализа данных. Кроме того, в отличие от других авторов, в силу ряда причин описывавших преимущественно центроидный метод ФА, мы уделим особое внимание более современным и компьютеризованным процедурам применения ФА. По возможности мы будем исключать экскурсы в математические основы той или иной процедуры, а сосредоточимся на описании основных этапов работы с эмпирическими данными и их трансформацией в ходе ФА. В силу специфики курса “Психологические измерения” в Общем психологическом практикуме изложение материала будет сопровождаться иллюстрациями использования 2-х статистических программ — “Stadia” и SPSS.

§ 1. Область применения факторного анализа

 

Необходимость применения ФА в психологии как одного из методов многомерного количественного описания (измерения, анализа) наблюдаемых переменных в первую очередь следует из многомерности объектов, изучаемых нашей наукой. Сразу же определим, что под многомерным представлением объекта мы будем понимать результат его оценивания по нескольким различным и существенным для его описания характеристикам-измерениям, т.е. присвоение ему сразу нескольких числовых значений. Из этого вполне естественно следуют два очень важных вопроса: насколько существенны и различны эти используемые характеристики. Первый вопрос связан с всесторонностью и полнотой описания объекта психологического измерения, а второй (в большей степени) — с выбором некоторого минимально разумного количества этих характеристик. Поясним сказанное выше на примере. Чем отличается хороший, профессионально сделанный психологический опросник от многочисленных “полупродуктов-полушуток”, во множестве публикуемых в периодической печати для широкой публики или в книгах непрофессионалов-дилетантов? Прежде всего тем, что в первом случае объект психологического измерения (конструкт) описывается разносторонне и полно, и, кроме того, в нем не содержится лишних, не относящихся к делу (т.е. “не работающих” на ту или иную шкалу) вопросов. Таким образом, при использовании методов многомерных измерений психологических характеристик наиболее важны две проблемы — описать объект измерения всесторонне и, в тоже время, компактно. С известной долей обобщения можно сказать, что это одни из основных задач, решаемых ФА.

Понятно, что информативность многомерного описания объекта нашего изучения возрастает с увеличением количества используемых признаков или измерительных шкал. Однако очень трудно выбрать сразу и существенные, и независимые друг от друга характеристики. Этот выбор порой непрост и долог. Как правило, исследователь начинает с заведомо избыточного количества признаков, и в процессе работы (например, по созданию нового опросника или анализу экспериментальных данных) сталкивается с необходимостью адекватной интерпретации большого объема полученных данных и их компактной визуализации. Анализируя полученные данные, исследователь замечает тот факт, что оценки изучаемого объекта, полученные по некоторым шкалам, сходны между собой, а если оценить это сходство количественно и подсчитать коэффициент корреляции, то он может оказаться достаточно высоким. Другими словами, возникает вопрос о том, что многие характеристики (т.е. переменные, по которым производилось измерение нашего объекта), вероятно, в некоторой степени дублируют друг друга, а вся полученная информация в целом избыточна. Внимательный исследователь, даже незнакомый с основами ФА, сразу же может сообразить, что за связанными друг с другом (коррелирующими) переменными, по-видимому, стоит влияние некоторой скрытой, латентной переменной, с помощью которой можно объяснить наблюдаемое сходство полученных оценок. Очень часто эту гипотетическую латентную переменную называют фактором. Приблизительно такаялогика заставила Чарлза Спирмена, психолога Оксфордского университета, в ходе анализа результатов тестирования способностей учеников английских школ предположить существование единого, генерального фактора интеллектуального развития человека, влияющего на многочисленные показатели разнообразных интеллектуальных тестов. Таким образом, давно известный метод научного познания — обобщение —приводит нас к возможности и необходимости выделения факторов как переменных более общего, более высокого порядка. Очень часто обобщение позволяет по-новому взглянуть на полученные данные, заметить те связи между исходными характеристиками (переменными), которые ранее были не очевидны, а после этого выйти на более высокий уровень понимания сущности измеряемого объекта.

Такого рода обобщение (т.е. сокращение размерности полученных данных) дает возможность использовать очень мощное средство научного анализа — графическое представление полученных данных. Понятно, что сокращение размерности результатов многомерного измерения какого-либо объекта до двух-трех позволит исследователю в очень наглядной и компактной форме представить весь объем полученных данных, выйдя за рамки логического анализа массы цифр, собранных в огромную таблицу. Имея в виду важное значение наглядно-образного мышления, трудно переоценить преимущества пространственного (графического) осмысления анализируемых данных. Таким образом, ФА может рассматриваться и как средство компактной визуализации данных.

Выделение в ходе анализа данных общего (для ряда переменных) фактора позволяет решать исследователю еще одну непростую задачу — оценивать некоторую скрытую от непосредственного наблюдения переменную (фактор) опосредованно, косвенно — через ее проявление (влияние) в ряде других, прямо измеряемых переменных. Подобным образом в психодиагностике личности были обнаружены, экстрагированы и измерены многие личностные конструкты, например: классический конструкт Айзенка импульсивность, оцениваемый в тесте EPI по ответам испытуемых на ряд вопросов, с разных сторон отражающих этот конструкт. Более того, ФА позволяет измерять не только прямо ненаблюдаемые (скрытые) переменные, но и оценивать определенные качества, которые могут намеренно скрываться и искажаться испытуемым при прямом их тестировании, однако проявляться (т.е. быть измеренными) косвенно через различные связанные с ними качества, оцениваемые прямо.

В ходе научного исследования ФА может выступать в двух ипостасях: как разведочный (эксплораторный) и как проверочный (конфирматорный) метод анализа данных. В первом случае ФА используется ex post factum, т.е. для анализа уже измеренных в эмпирическом исследовании переменных и, фактически, помогает исследователю их структурировать; на этом этапе совсем не обязательно делать априорные предположения о количестве факторов и их связях с наблюдавшимися переменными. Здесь главное значение ФА — структурировать связи между переменными, помочь сформулировать рабочие гипотезы (пусть иногда и очень умозрительные) о причинах обнаруженных связей. Как правило, такое использование ФА характерно для начальной, ориентировочной стадии работы, когда многое неявное кажется явным, непростое — простым, и наоборот. В отличие от разведочного, конфирматорный ФА используется на более поздних стадиях исследования, когда в рамках какой-либо теории или модели сформулированы четкие гипотезы, связи между переменными и факторами достаточно определены, и исследователь их может прямо указать. Тогда конфирматорный ФА выступает как средство проверки соответствия сформулированной гипотезы полученным эмпирическим данным.

Обобщая вышесказанное, выделим основные цели использования ФА:

1. Понижение размерности числа используемых переменных за счет их объяснения меньшим числом факторов. Обобщение полученных данных.

2. Группировка, структурирование и компактная визуализация полученных данных.

3. Опосредованное, косвенное оценивание изучаемых переменных в случае невозможности или неудобства их прямого измерения.

4. Генерирование новых идей на этапе разведочного анализа. Оценка соответствия эмпирических данных используемой теории на этапе ее подтверждения.

 

§ 2. Исходные принципы и предположения

 

Основные общенаучные идеи, лежащие в основе ФА, достаточно просты и могут быть, по мнению П. Благуша (1989), сформулированы так:

а) “сущность вещей заключена в их простых и вместе с тем многообразных проявлениях, которые могут быть объяснены с помощью комбинации нескольких основных факторов”, т.е. за наблюдаемой вариацией достаточно большого количества переменных стоит ограниченное число факторов;

б) “общую сущность наблюдаемых вещей мы постигаем, совершая бесконечные приближения к ней”, т.е. поиск факторов — это длительный процесс познания посредством перехода к факторам все более высокого порядка.

Первым основным формально-математическим принципом, лежащим в основе классической модели ФА1, является постулат о линейной зависимости между психологическими характеристиками (наблюдаемыми переменными), с помощью которых оценивается какой-либо объект. Количественно степень этой зависимости (связи) может быть оценена с помощью коэффициента корреляции. Второе основное предположение состоит в том, что эти наблюдаемые переменные (предполагается, что их заведомо избыточное количество) могут быть представлены как линейная комбинация некоторых латентных переменных или факторов. Полагается, что ряд этих факторов являются общими для нескольких переменных, а другие, характерные факторы, специфическим образом связаны только с одной переменной. Поскольку последние ортогональны друг к другу, то, в отличие от общих факторов, они не вносят вклад в корреляцию (ковариацию)2между переменными. Таким образом, математическая модель ФА сходна с обычным уравнением множественной регрессии:

Vi = Ai,1F1 + Ai,2F2 + ... + Ai,kFk+ U, (1)

 

где

Vi — значение i-й переменной, которое выражено в виде линейной комбинации k общих факторов, Ai,k— регрессионные коэффициенты, показывающие вкладкаждого из k факторов в данную переменную; F1...k— факторы, общие для всех переменных; U — фактор, характерный только для переменной Vi .

 

Уравнение (1) выражает весьма простой смысл: каждая переменная может быть представлена в виде суммы вкладов каждого из общих факторов. С другой стороны, аналогичным образом, каждый из k факторов выражается в виде линейной комбинации наблюдаемых переменных:

Fj = Wj,1*V1+ Wj,2*V2+ ... +Wj,p*Vp, (2)

 

где Wj,i— нагрузки j-го фактора на i-ю переменную или факторные нагрузки; p — количество переменных.

 

На рис. 1 факторные нагрузки (w1,1 ... w2,6) обозначены различными стрелками, показывающими влияние фактора на конкретную переменную. Переменные v1, v2 и v3 преимущественно связаны с фактором F1, и только фактор F2 имеет небольшую нагрузку на первую переменную; для других трех переменных (v4, v5, v6) общим фактором является F2, и лишь на четвертую переменную F1 имеет незначительную нагрузку. Эмпирические оценки наблюдаемых переменных v1 ... v6 представлены в столбцах a, b, c, d, e, f, соответственно. Дугообразная стрелка, соединяющая факторы и коэффициент корреляции над ней, подчеркивают факт ортогональности (некоррелированности, линейной независимости) этих факторов, хотя в общем случае (об этом ниже) это предположение критично лишь на этапе выделения первоначальных факторов, а в дальнейшем, на этапе интерпретации факторного решения, при вращении факторной структуры допускается возможность корреляции между факторами. (Это один из многих парадоксов ФА, связанный с многозначностью получаемого факторного решения, которое не имеет строго однозначного математического обоснования.)

 
 

 


Рис.1. Гипотетическая модель с двумя общими факторами (F1 и F2) и шестью переменными (v1 ... v6)

 

Пользуясь схемой (рис. 1), еще раз обозначим основную задачу ФА: основываясь на эмпирических оценках (a, b, c, d,e, f) исследуемого объекта по каждой из шести переменных-характеристик (v1 ... v6), исследователь пытается объяснить взаимосвязь наблюдаемых переменных влиянием 2-х общих факторов, в которых находят свое отражение эти переменные.

 

§ 3. Основные этапы факторного анализа

 

В ходе исследования с использованием разведочного ФА можно выделить три различных этапа: 1) сбор эмпирических данных и подготовка корреляционной (ковариационной) матрицы; 2) выделение первоначальных (ортогональных) факторов; 3) вращение факторной структуры и содержательная интерпретация результатов ФА. Остановимся на них подробнее.

1. Сбор эмпирических данных в психологическом исследовании разведочного плана всегда опосредован использованием какой-либо измерительной процедуры, в ходе которой испытуемый оценивает измеряемый объект (стимул) по ряду предложенных исследователем характеристик. На этом этапе очень важно, чтобы исследователем был предложен достаточно большой набор характеристик, всесторонне описывающих измеряемый объект. Подбор важных и разнообразных характеристик и одновременно исключение лишних и несущественных — это достаточно трудное дело, требующее от исследователя опыта, знания литературы и, в известной степени, интуиции. Именно продуманный и удачный подбор оцениваемых характеристик определяет в конечном счете успех в выделении существенных и значимых факторов, стоящих за ними — это основное, о чем нельзя забывать на данном этапе. Иначе говоря, из случайного набора характеристик объекта невозможно выделить такие факторы, которые будут закономерно и содержательно определять его оценку испытуемыми. Понятно, что с первого раза, априорно бывает трудно подобрать нужные характеристики. Поэтому еще раз напомним, что разведочное исследование с помощью ФА — это длительный и интеративный процесс, когда результаты предыдущего анализа позволяют оценить допущенные ошибки и скорректировать процедуру последующего исследования.

Второе существенное замечание возникает в связи с постулатом линейности. В случае, когда связь между психологическими характеристиками оказывается существенно нелинейной, базисная размерность искомого факторного пространства возрастает, и это приводит к ложному решению. Преодоление этой трудности может идти двумя путями. Во-первых, можно использовать коэффициент криволинейной корреляции (по Пирсону, например), а во-вторых, следует избегать тех психологических переменных, которые имеют между собой явно нелинейные связи.

На данном этапе нельзя не коснуться вопроса о необходимом уровне измерения, поскольку он в первую очередь связан с использованием конкретного метода измерения. Вычислительные алгоритмы ФА требуют, чтобы измерения наблюдаемых переменных были проведены не ниже, чем по шкале интервалов. Это требование, к сожалению, выполняется далеко не всегда, что, впрочем, связано не столько с неосведомленностью исследователя, сколько с ограниченностью выбора измерительного метода и/или его адекватностью конкретной задаче или даже процедуре исследования. Реалии практики использования ФА в психологии таковы, что в подавляющем большинстве работ применяется один из вариантов метода балльной оценки, который, как известно, дает шкалу порядка. Налицо явное ограничение в использовании ФА. При решении данной проблемы следует иметь в виду следующее. Во-первых, стоит уделить максимальное внимание проработке процедурных моментов в использовании метода балльной оценки, чтобы выйти за установление только порядковых отношений и максимально “приблизиться” к шкале интервалов. Во-вторых, следует помнить, что математическая процедура ФА оказывается достаточно устойчивой к разного рода измерительным некорректностям при оценке коэффициентов корреляции между переменными. И наконец, в самой математической статистике существуют различные подходы к решению данной проблемы (Дж. Ким, Ч. Мьюллер,1989), и для более качественной (не строго метрической) трактовки результатов ФА указанное ограничение приобретает не слишком принципиальное значение.

Достаточно важен вопрос о количестве используемых переменных или, более операционально, о том, сколько переменных должно приходиться на один гипотетический фактор. Вслед за Терстоуном многие авторы считают, что в разведочном ФА на один фактор должно приходиться не менее трех переменных. Для конфирматорного ФА эта пропорция меньше и, как правило, исследователи ограничиваются двумя переменными. Если исследователя интересует оценка надежности получаемых факторных нагрузок, существуют и более строгие оценки количества необходимых переменных (Дж. Ким, Ч. Мьюллер, 1989).

Формальный итог первого этапа — получение матрицы смешения и на ее основе — корреляционной матрицы. Матрица смешения — это таблица, куда заносятся результаты измерения наблюдаемых переменных: в столбцах матрицы (по числу переменных) представлены оценки испытуемых (или одного испытуемого) каждой из переменной; строки матрицы — это различные наблюдения каждой переменной. Если задача исследователя — построить факторное пространство для одного испытуемого, то нужно обеспечить множественность таких наблюдений (например, повторить их несколько раз). В том случае, когда строится групповое факторное пространство, достаточно получить по одной оценке от каждого испытуемого. Для последующего расчета по этим данным корреляционной матрицы с достаточно достоверными коэффициентами корреляции следует обеспечить необходимое число наблюдений, т.е. количество строк в матрице смешения. Обычно не следует планировать менее 11—12 наблюдений.

Корреляционная матрица (матрица попарных корреляций между переменными) рассчитывается, как правило, с использованием коэффициента линейной корреляции Пирсона. Часто возникает вопрос о возможности и правомерности использовать другие меры сходства (сопряженнности) между переменными, основанные на ранговой (порядковой) статистике. Понятно, что данный вопрос возникает всегда, когда исследователь работает с номинальными или порядковыми данными. В строгом смысле ответ будет отрицательным. Однако следует принять во внимание два соображения. Во-первых, показано, что при достаточном числе наблюдений коэффициент линейной корреляции Пирсона достаточно устойчив к использованию при расчетах результатов порядковых измерений. Во-вторых, как было отмечено выше, если перед исследователем стоит задача не столько количественного, сколько качественного анализа данных, то такое эвристическое использование ФА считается вполне оправданным.

Еще один тонкий вопрос, связанный с построением матрицы попарных корреляций связан с тем, какую матрицу использовать в ФА — корреляционную или ковариационную? Для начала напомним соответствующие формулы.

Коэффициент ковариации

(3)

между двумя переменными x и y, а коэффициент корреляции:

rxy = Cov/sxsy , (4)

где n — количество наблюдений; xi и yi — значения переменных x и y ;X и Y — средние арифметические значения переменных x и y по ряду наблюдений; sx и sy — средние квадратические отклонения переменных x и y по ряду наблюдений.

 

Таким образом очевидно, что коэффициент корреляции — это тот же коэффициент ковариации, только нормированный по среднему квадратическому отклонению или, как еще говорят, выраженный в единицах среднего квадратического отклонения переменных. Из этого следуют и “рецепты” по применению в ФА корреляционной или ковариационной матриц:

1) если все переменные выражены в одних и тех же единицах измерения, то нет большого различия, какую из матриц факторизовать;

2) если метрики переменных заметно отличаются (единицы измерения значительно неоднородны и дисперсии переменных заметно отличаются), то целесообразно использовать анализ корреляционной матрицы;