Дифференциальная психометрика
Понятие психологического измерения. В настоящее время практическая психология обогащается все новыми и новыми методами исследования личности и группы, основывающимися на психологическом измерении особенностей. При разработке методик психологического оценивания обычно учитываются пять основных требований: 1) отбор стимульных заданий, 2) присвоение определенной оценки их решению, 3) точность балла, 4) обоснованность интерпретации итогов психологического измерения и 5) сравнение оценки с результатами других методов[1]. Это значит, что измерение в психологии связано с количественной оценкой свойств, в основу которой положена операция сравнения. Сравниваются психологические показатели испытуемых с определенной нормой, критерием или показателями в иной ситуации. Операция сравнения, таким образом, видоизменяется. К видам психологического измерения относятся нормативное, критериальное и ипсативное[2].
Нормативное измерение представляет собой процесс сравнения тестового показателя развития измеряемого свойства или качества испытуемого с серединным признаком свойства, который выполняет функцию нормы. В зависимости от уровня (шкалы) психологического измерения[3] норма может быть выявлена по модальному, медианному или среднему признаку.
Нормативное психологическое измерение на номинальном уровне предполагает, что частота его проявления доминирует среди проявления других признаков. Например, если в группе измерены четыре признака: А, Б, В и Г, которые проявляются соответственно в 25, 10, 45 и 20% случаев, то модальным является признак, проявившийся наибольшее количество раз, т.е. признак В (в 45% случаев).
При нормативном психологическом измерении на ранговом (ординальном) уровне используется так называемая перцентильная (процентильная) шкала, построение которой также не обусловлено видом распределения эмпирических оценок. Единственное условие – это возможность ранжирования показателей по величине. Единицы перцентильной шкалы отличаются тем, что арифметически одинаковые различия перцентильных оценок могут не соответствовать равным различиям в интенсивности оцениваемого свойства. В данном случае нормой может являться медианная переменная, разделяющая ранговый ряд пополам. Допустим, что переменные А, Б, В, Г и Д выстроены в порядке убывания признака. Серединным (в данном случае медианным) положением обладает переменная В. Оценка переменных может осуществляться относительно признака В, т.е. переменные А и Б занимают, например, место более выраженного свойства, а переменные Г и Д – менее выраженного.
В нормативном измерении на интервальном уровне используется предположение о равенстве единиц измерения показателя теста во всем интервале его вариации, когда нормативом выступает зона средних значений, или среднеарифметическое (математическое ожидание). Для сравнения показателей разных тестов они могут переводиться в стандартные шкалы.
Связь многих статистических параметров с нормальным распределением определяет предпочтительность нормального распределения тестовых оценок. Если эмпирическое распределение отличается от нормального, оно может быть в большинстве случаев нормализовано искусственно (или стандартизировано).
Критериальное психологическое измерение[4] основано на прямой оценке результатов работы испытуемого без сравнения с другими испытуемыми в соответствии с определенным объективным уровнем (критерием) развития качества, свойства. Иными словами, в данном случае производится сопоставление эмпирического результата с так называемой объективной нормой или качеством выполнения функции.
Ипсативное психологическое измерение[5] нацелено на оценку внутрииндивидуальных соотношений и не связано с изучением межиндивидуальных различий. То есть происходит сравнение показателя методики в различных ситуациях с его же значением в нормальном или ином состоянии. Например, в психофизиологии у конкретного субъекта исследуется пульс после нагрузки в соотношении с пульсом в покое (до нагрузки).
В рамках исследования психологических особенностей людей или групп определены четыре уровня измерения[6]. Б. В. Кулагин в книге "Основы профессиональной психодиагностики"[7] приводит таблицу, в которой определены наименования уровней измерения и статистические процедуры, им соответствующие, по С. Стивенсу (табл. 1.2).
Уровни измерения являются базой построения измерительных шкал. Информация, полученная в результате психологического исследования, должна проходить процедуру шкалирования. "Модель шкалирования определяет способ выведения баллов, уровень полученного измерения (тип шкалы) и выбор способов оценки функционального единства полученного инструмента измерения"[8]. В практической психологии принято шкалирование по четырем основным шкалам, хотя, видимо, их существует больше[9].
Рассмотрим основные шкалы психологического измерения и их модификации.
1. Описание в естественном языке. Примером практического применения данной шкалы измерения служит результат составления психологической характеристики какого-либо человека, обратившегося для консультации или проходящего психологическое освидетельствование в процессе решения кадровых задач. В ней, как правило, излагается текстовый материал, характеризующий данного клиента и отличающий его от других людей. Данное описание характерологических и поведенческих особенностей субъекта даст возможность умозрительно сравнить его психологические признаки с признаками другого человека. Собственно говоря, в этом пункте и начинается измерение.
Таблица 1.2
Уровни психологического измерения по С. Стивенсу
Уровень измерения |
Основная операция, определяющая уровень |
Допустимое преобразование |
Статистические величины для данного уровня |
Примеры |
Поминальный |
Приписывание одинаковых чисел- наименований объектам, имеющим общий признак |
х' =f(x), где f(x) - замена одного числа- наименования другим |
Число объектов в классе (категории) коэффициент ассоциации |
Приписывание числового кода лицам с определенными социальнодемографическими характеристиками |
Ординальный |
Ранжирование объектов по выраженности определенного признака |
х2=f(x), где f(x) – любая монотонно нарастающая функция |
Медиана; перцентили |
Ранжирование специалистов по степени профпригодности |
Интерваль- ный |
Определение величины различий между объектами |
Средняя арифметическая; дисперсия; коэффициент корреляции |
Шкала температуры по Цельсию |
|
Измерение отношений |
Определение равенства отношений величин |
Коэффициент вариации |
Измерение длины, массы |
В строгом смысле слова психологическое измерение основывается на методах параметрической и непараметрической статистики. В рамках непараметрических шкал уже активно используются математические методы, но они ограничены в возможностях применения всей широты спектра статистических средств.
2. Непараметрические шкалы. К непараметрическим шкалам относятся шкала наименований и порядковая шкала.
• Шкала наименований (нечеткая (размытая) классификация). ОГЛАВЛЕНИЕм данной шкалы является сопоставление признаков реальных объектов с эталоном, т.е. поиск степени подобия эталону (Л). Эталоном может выступать идеальный объект (например, перечень профессионально значимых качеств, характеристика психологического типа) или реальный объект (лучший в профессии, отдельный субъект).
Абсолютного подобия (идентичности) эталону не существует. Поэтому подобие определяется степенью совпадения признаков. В практике распространена Вперед ситуация, где В подобно А; С подобно А; но В не подобно С.
Пример: выявлены характерологические черты у одного (A), другого (В) и третьего (С) испытуемых. Некоторые черты (признаки) одного субъекта (Л) имеют место в характеристике другого (В). Эти люди имеют сходные и различительные черты в индивидуальных характеристиках. Л подобно В. Если у субъектов В и С нет сходных черт характера, то В не подобно С. В то же время у Л и С могут быть сходные характерологические черты.
Если в процессе диагностических исследований оценка подобия психологических характеристик людей при помощи математических расчетов встречается довольно редко, то в психологии профессий идентичность специальностей определяется с использованием коэффициента сопряженности.
Пример: для расчета сопряженности профессий (специальностей) воспользуемся данными, приведенными в табл. 1.3.
Таблица 1.3
Сопоставление профессионально значимых качеств профессий
Профессионально значимые качества |
Профессия 1 |
Профессия 2 |
Длительное сохранение информации в памяти |
+ |
- |
Умение выделить в информации главное, существенное |
– |
+ |
Умение примять решение в очень короткий срок |
+ |
+ |
Способность четко, лаконично формулировать сообщения, распоряжения |
+ |
+ |
Способность правильно и быстро формулировать свои мысли письменно |
+ |
+ |
Самообладание и выдержка |
- |
+ |
Дисциплинированность |
+ |
- |
Общительность, способность легко вступать в контакт с людьми |
+ |
- |
Способность находить компромиссные решения в конфликтных ситуациях |
+ |
+ |
Гибкость во взаимоотношениях с людьми |
+ |
+ |
Коэффициент сопряженности специальностей (профессий) рассчитывается по формуле
где Сп – коэффициент сопряженности специальностей[10];
– суммарное количество идентичных признаков (качеств); – суммарное количество всех профессионально значимых признаков (качеств); S – количество специальностей.
Для нашего примера .
И как вывод: профессии значимо сопряжены или подобны.
• Шкала наименований (строгая классификация). ОГЛАВЛЕНИЕ данной шкалы может быть описано логическим правилом: А – не В; В – нс С; С – не D и т.д. Шкала строго определяет отличие одного измеренного признака (или субъекта) от другого. Часто в опросниках успешно используется дихотомическая шкала "да – нет", которая интерпретируется в форме присутствия/отсутствия исследуемого признака, т.е. "данный признак есть или нет". Например: дифференциально-диагностический опросник Е. Климова интерпретируется в рамках данной шкалы как наличие у субъекта признаков, относящихся к пяти категориям (типам деятельности): "человек", "техника", "знаковая система", "природа" и "художественный образ". Номинальная принадлежность субъекта к одной из областей определяет отсутствие у него признаков других категорий.
• Шкала порядков, или ранговая шкала, строгой упорядоченности. В порядковой шкале строгой упорядоченности действует логическая схема А > В: В > С; С > D и т.д.
• Шкала порядков, или ранговая шкала, нестрогой упорядоченности. В порядковой шкале нестрогой упорядоченности действует логическая схема "больше или равно – меньше или равно": А> В; В > С; С> D и т.д.
Примером ранговых шкал являются различные рейтинговые оценки испытуемых или экспериментальных групп. Нестрогая упорядоченная ранговая шкала имеет место в случаях равенства ранговой оценки, когда испытуемым присваивается одинаковый ранговый балл.
3. Параметрические шкалы. Когда исследователь может измерить психологический признак, сказав при этом, что данные феномены различаются между собой на определенное количество условных единиц, то здесь появляется новый уровень измерений, основанный на параметре. Именно на параметрическом уровне измерения базируется математическая статистика.
К параметрическим шкалам относят интервальную шкалу, шкалу отношений и абсолютную шкалу.
• Шкала интервалов (интервальная). Отличие данного типа шкалы от других параметрических шкал состоит в том, что начало отсчета (ноль) и интервалы выбираются условно. Здесь действует логическое правило, что, например, между психологическими признаками A и В существует различие, измеряемое десятью условными единицами. Это интерпретируется как А больше (или меньше) В на 10 единиц. Если, например, качество "коммуникабельность" субъекта А составляет стандартные 10 стэнов, а субъекта В – 7 стэнов, то по данному признаку субъект А более коммуникабелен, чем субъект В, на 3 стэна. Из этого примера видно, что и точка отсчета величины признака, и интервал выбраны условно. Однако расчетный стандартизированный интервал позволяет полагать, что на доверительном уровне (95%) разница между А и В постоянна и равна определенному значению. В повседневной житейской практике измерение температуры происходит также в шкале интервалов, так как, во-первых, при 0°С температура не отсутствует вообще, а, во-вторых, интервалы, выраженные в градусах, являются делением относительным.
• Шкала отношений. Применение шкалы отношений осуществляется в психофизиологических исследованиях. ОГЛАВЛЕНИЕм данной шкалы является наличие абсолютной точки отсчета, от которой идет относительно равный отсчет. Житейским примером такой измерительной шкалы является измерение длины и веса, где имеет место точка отсчета (отсутствие веса или длины), а интервалы – общепринятые единицы. В физиологии деятельность сердца (частота сердечных сокращений – ЧСС) измеряется в шкале отношений.
• Абсолютная шкала[11]. Данная оценочная шкала применяется в ситуации, когда есть ноль (отсутствие признака или качества), от которого идет отсчет в абсолютных долях. Примерами могут служить физические измерения, в частности регистрация количества электронов в атоме, заряд ядра и т.п.
Названные одномерные шкалы (кроме абсолютной) могут быть преобразованы в другие шкалы более низкого уровня, т.е. возможно понижение мощности шкалы. Так, интервальная шкала довольно легко может быть представлена в форме ранговой (по рейтингу балла), а также при наличии критерия (величины признака или его границ) – в номинальной. Возможно и обратное преобразование в шкалы более высокого уровня (повышение мощности шкалы). Одномерные психологические шкалы, полученные в результате измерения одного и того же признака у одного и того же объекта при использовании различных инструментов, могут также преобразовываться в многомерные шкалы путем конструирования функциональных зависимостей между ними.
Применение статистических методов в психологических измерениях. Для обработки и анализа эмпирических данных, полученных в результате исследования, психологи применяют различные методы математических исчислений. Первым этапом работы является проверка гипотезы о виде статистического распределения данных. Это необходимо с целью определения допустимого уровня психологических измерений. Как известно, если экспериментальные данные распределены согласно нормальному закону (закону Гаусса – Лапласа), то в процессе математического анализа корректно использовать методы параметрической статистики, в противном случае – непараметрической.
В каждой метрической шкале используются определенные статистические методы. Методы непараметрической статистики применимы в номинальной и порядковой шкалах, параметрической – в интервальной и более мощных шкалах. Если психолог пользуется баллами и получает интервалы измерения, это не обязательно означает, что он может применять параметрическую статистику. В данном случае следует еще доказать, что полученные результаты имеют нормальное распределение.
Распределение эмпирических данных. Любое социальное исследование, связанное с применением статистики и теории вероятностей, имеет целью изучение большого числа людей, их признакового пространства для обобщений и типологических выводов относительно всей или части наблюдаемой популяции. В психометрии эта часть популяции называется генеральной совокупностью. Психолог не в состоянии изучить свойства всей генеральной совокупности. Поэтому он работает с выборкой (частью популяции, генеральной совокупности, группой), а выводы с учетом определенных процессуальных правил распространяет на всю генеральную совокупность. Таким образом, исследователь, изучая свойства относительно небольшой группы, получает знание о свойствах генеральной совокупности. Характеристики распределения генеральной совокупности называются параметрами, а характеристики выборочного распределения – оценками параметров. Для возможности применения методов параметрической статистики осуществляется процедура определения вида статистического распределения эмпирических данных.
По теореме Я. Бернулли (1713) при бесконечном увеличении объема выборки эмпирическое распределение по вероятности стремится к распределению теоретическому. То есть чем больше количество наблюдений, тем больше вероятность их совпадения и тем более гладким будет график распределения данных. Теоретически, в условиях неопределенности, результаты психологических переменных зависят от случайности и определяются большим количеством независимых факторов, влияние которых учесть невозможно. Но чем больше объем эмпирических данных, тем ближе реальное распределение к теоретически ожидаемой нормальной вероятности. График нормального распределения был впервые построен математиками П. Лапласом и К. Гауссом в результате исследований в области теории игр. В XIX в. бельгийский статистик А. Кутелет первым применил понятие нормального распределения эмпирических данных к исследованию антропометрических качеств человека. Он, в частности, заметив сходство графика нормального распределения с данными изменчивости антропометрических признаков, создал теорию, согласно которой стремление исследователей к экспериментальному "идеалу", или норме, наталкивается в силу различных обстоятельств на неудачу. Опыт Кутелета по применению нормального распределения был переосмыслен и развит Ф. Гальтоном, который активно пользовался графиком нормального распределения для квантификации и преобразования данных индивидуальных и групповых различий.
Метод наименьших квадратов в сочетании с нормальным распределением эмпирических данных служит основой классической статистики. Предположения о нормальном распределении данных носят модельный характер и не могут выполняться абсолютно точно.
Статистические выводы, составленные на основе модели, приближенной к нормальному распределению, носят также более или менее приближенный характер. Оценка приближенности практической кривой к параметрам нормали осуществляется при помощи расчета: а) асимметрии и эксцесса и б) критериев согласия Пирсона (Хи-квадрат), Колмогорова (1933) и Ястремского (1949).
В первом случае оценивается положение вершины эмпирической кривой относительно теоретической нормали, во втором – положение определенных участков (групп частот) практической кривой относительно теоретической нормали.
Оценка положения вершины эмпирической кривой относительно теоретической нормали при помощи расчета асимметрии и эксцесса. Коэффициент асимметрии (Αs) показывает величину смещения вершины эмпирической кривой относительно расчетной вершины по горизонтали (вправо "+"; влево "-"). Коэффициент эксцесса (Ех) определяет крутизну практической кривой. То есть смещение по вертикали вверх определяет "+", а вниз – "-" (рис. 1.6).
Коэффициент асимметрии As рассчитывается по формуле
где δ – среднеквадратическое отклонение (стандартное отклонение); п – количество испытуемых, подвергнутых процедуре тестирования; – среднеарифметическое (математическое ожидание); xi – значение показателя теста.
Коэффициент эксцесса Ех рассчитывается при помощи формулы
Рис. 1.6. Распределение эмпирических данных относительно теоретической кривой (распределение Гаусса – Лапласа)
Допустимые пределы отклонений от теоретической кривой, когда возможно применение методов параметрической статистики (среднее, стандартное отклонение, коэффици
енты корреляции и т.п.), определяются согласно неравенствам П. Л. Чебышева[12]:
где Sa – дисперсия эмпирической оценки асимметрии; р – вероятность появления ошибки;
где Se – дисперсия эмпирической оценки эксцесса.
Пример. В табл. 1.4 представлены данные тестирования двух выборок испытуемых (группа А и группа В).
Таблица 1.4
Эмпирические данные, полученные в результате исследования
№ п/п |
хi |
|
А |
В |
|
1 |
2 |
3 |
2 |
5 |
2 |
3 |
3 |
2 |
4 |
4 |
1 |
5 |
3 |
3 |
6 |
5 |
4 |
7 |
е |
5 |
8 |
4 |
6 |
9 |
4 |
4 |
10 |
4 |
3 |
Σ |
40 |
33 |
В результате расчета коэффициентов асимметрии и эксцесса получено:
Расчет дисперсии эмпирической оценки асимметрии и эксцесса осуществляется следующим образом:
Исследование отклонений эмпирических данных от теоретической нормали (распределения Гаусса–Лапласа) показано в табл. 1.5.
Таблица 1.5
Исследование отклонений эмпирических данных
Согласно критериям П. Л. Чебышева |
Из практики отбора персонала |
|
а) по асимметрии: |
||
группа А |
0 < 0,4 |
0 < 1,14 |
группа В |
0,21 < 0,4 |
0,21 < 1,14 |
б) по эксцессу: |
||
группа А |
0,94 > 0,59 |
0,94 < 1,68 |
группа В |
0,97 > 0,59 |
0,97 < 1,68 |
Вывод о распределении эмпирических данных таков. Распределение эмпирических данных имеет значимое отрицательное смещение по вертикали[13]. Это говорит о "плоском" профиле распределения признаков вокруг средних значений (дифференциация признаков) при соблюдении его симметричности. В целом распределение близко к теоретической нормали и измеренные свойства эмпирических переменных отражают свойства генеральной совокупности. Наблюдается относительная дифференциация исследуемых признаков. В данном случае возможно в принципе применение методов параметрической статистики.
Оценка положения определенных участков (групп частот) практической кривой относительно теоретической нормали при помощи критерия согласия Пирсона (Хи-квадрат). Оценка нормальности распределения эмпирических данных может осуществляться при помощи критерия согласия Пирсона (χ2), который вычисляется по формуле
где – частоты тестовых данных; – теоретические частоты.
Определяется вероятность соответствия практической частоты проявления признака (по показателям теста) с теоретическим распределением (по специальным таблицам). Следует заметить, что оценка распределения по на практике обычно осуществляется при помощи компьютера.
В итоге исследования параметров распределения эмпирических данных в рамках психодиагностики можно сделать два практических замечания.
1. Если распределение тестовых данных близко к нормальному теоретическому распределению, то возможно применение методов параметрической статистики.
2. При условии нормальности распределения эмпирических данных тест хорошо дифференцирует испытуемых по структуре измеряемого свойства и в целом отражает свойства изучаемой популяции.
Однако часто в практике исследований распределения психологических данных проявляются, кроме нормального, и другие модели. Можно назвать по крайней мере три вида кривых. Это симметричное, асимметричное (скошенное) и бимодальное распределение. Симметричное распределение может быть заостренного (Ех > 0) и уплощенного (Ех < 0) типов (рис. 1.7).
Рис. 1.7. Симметричное распределение эмпирических данных
График асимметричного распределения данных часто называют J-распределением С. Пуассона (рис. 1.8).
Рис. 1.8. Асимметричное распределение эмпирических данных
При наложении данных, распределенных по закону Пуассона, скошенных влево и вправо, получается бимодальная результирующая (рис. 1.9).
Рис. 1.9. Бимодальное распределение эмпирических данных
Основными факторами, влияющими на форму графика распределения эмпирических данных в психологических исследованиях, являются: неадекватность выборки, использование невалидных или ненадежных средств измерения психологических переменных и условия, непосредственно воздействующие на изучаемое качество.
Особо следует подчеркнуть, что неадекватность выборки имеет место в результате некачественного отбора испытуемых, когда в ходе диагностики, когда отсеиваются люди, показывающие неудовлетворительные результаты, кривая нормального распределения преобразуется в J-кривую Пуассона. В частности, распределение психологических данных в форме J-кривой впервые использовал Ф. Оллпрот (1934) для изучения социального конформизма.