Стандартизация, надежность и валидность теста

Рассмотрим понятия стандартизации, надежности и ва-лидности теста с позиций классической эмпирико-ста-тистической теории. В соответствии с этой теорией конструи­рование тестов для изменения психологических свойств и состояний основано на шкале интервалов. Измеряемое пси­хическое свойство считается линейным и одномерным. Пред­полагается также, что распределение совокупности людей, обладающих данным свойством, описывается кривой нор­мального распределения.

В основе психологического тестирования лежит класси­ческая теория погрешности измерений. Считается, что тест — такой же измерительный прибор, как любой физический при­бор, и результаты, которые он показывает, зависят от вели­чины свойства у испытуемого, а также от самой процедуры измерения. Любое свойство психики имеет «истинный» по­казатель, а показания по тесту отклоняются от истинного на величину случайной погрешности. На показания теста влияет и «систематическая» погрешность, но она сводится к прибав­лению (вычитанию) константы к «истинной» величине пара­метра, что для интервальной шкалы значения не имеет.

Надежность теста. Если тест проводить много раз, то сред­нее значение будет характеристикой «истинной» величины параметра. Под надежностью теста принято понимать устой­чивость результатов к воздействию случайных факторов, внешних и внутренних. Наиболее часто проводится опенка ретестовой надежности. Чем теснее коррелируют результа­ты начального и повторного (обычно отсроченного на не­сколько месяцев) проведения теста, тем он надежнее.

Предполагается, что существует неограниченное количество заданий, которые могут «работать» на измеряемое свойство. Тест есть лишь выборка заданий из их генеральной совокуп­ности. В идеале можно создать сколько угодно эквивалентных форм теста, поэтому определение надежности теста можно про­вести путем корреляции параллельных форм или эквивалент­ных равных частей, полученных путем расщепления тестового задания на две части. Поскольку в реальном тесте число зада­ний ограничено (не более 100), то оценка надежности теста всег­да приблизительна. Тест считается надежным, если коэффи­циент корреляции результатов составляет не менее 0,75.

Валидность теста. Проблеме валидности в классической тео­рии теста уделяется много внимания, однако теоретически она никак не решается. Валидность означает пригодность теста из­мерять то свойство, для измерения которого он предназначен. Следовательно, чем больше на результат выполнения теста или отдельного задания влияет измеряемое свойство и чем меньше другие переменные (в том числе внешние), тем тест валиднее.

Т ест валиден (и надежен), если на его результаты влияет лишь измеряемое свойство. Тест невалиден (и ненадежен), если результаты тестирования определяются влиянием нере­левантных переменных.

Существуют следующие виды валидности теста.

Очевидная валидность. Тест считается валидным, если у ис­пытуемого складывается впечатление, что он измеряет то, что должен измерять.

Конкретная валидность (конвергентная — дивергентная валидность). Тест должен хорошо коррелировать с тестами, измеряющими конкретное свойство либо близкое ему по со­держанию, и иметь низкие корреляции с тестами, измеряю­щими заведомо иные свойства.

Прогностическая валидность. Тест должен коррелировать с отдаленными по времени внешними критериями.

Содержательная валидность. Тест должен охватывать всю область изучаемого поведения.

Конструктная вшидность. Предполагает полное описание измеряемой переменной, выдвижение системы гипотез о связях ее с другими переменными, эмпирическое подтверждение (неопровержение) этих гипотез.

С теоретической точки зрения единственным способом уста­новления «внутренней» валидности теста и отдельных заданий является метод факторного анализа (и аналогичные), который позволяет: а) выявлять латентные (скрытые) свойства и вы­числять значение «факторных нагрузок» — коэффициенты де­терминации свойств тех или иных поведенческих признаков; б) определять меру влияния каждого латентного свойства на результаты тестирования.

Стандартизация теста заключается в приведении про­цедуры оценок к общепринятым нормативам. Стандартизация федполагает преобразование нормальной или искусственно формализованной шкалы первичных оценок в шкальные щенки (подробнее об этом см. 5.2). Тестовые нормы, полученные в ходе стандартизации, представляют собой систему , икал с характеристиками распределения тестового балла для .различных выборок. Они не являются «внутренними» свойствами теста, а лишь облегчают его практическое применение.