Занятие 10.3 ПРОВЕРКА НАДЕЖНОСТИ ТЕСТА

Цель работы. Проверка надежности теста методом «тест-ретест» и методом расщепления «четное-нечетное», оценка плотности теста (консистенции).

Определение основных понятий. Надежность - характеристика теста, отражающая точность измерения и стабильность результатов. Количественно оценивается коэффициентом надежности

f = = 1 - ,

где S_t - «истинная» дисперсия теста; S_х - эмпирическая дисперсия теста; S_е - дисперсия ошибки.

Прямая оценка коэффициента надежности невозможна (принципиально невозможно непосредственно определить S_t и S_е), поэтому применяют косвенные корреляционные методы, например метод «тест-ретест», метод расщепления.

Метод «тест-ретест» заключается в следующем: через некоторое время после первого проводится повторное тестирование с достаточным временным интервалом. Оценкой надежности служит коэффициент корреляции (Пирсона, ранговый или какой-либо иной, в зависимости от типа шкальных значений результатов тестирования).

Метод расщепления на части, в данной работе - на две части по принципу «четные-нечетные задания». В этом методе сопоставляются четные и нечетные номера заданий. Сила связи между этими двумя частями теста характеризует его надежность.

Возможно расщепление теста на любое количество частей. В предельном случае количество частей равно количеству заданий теста. Надежность в этом случае оценивается коэффициентом плотности (консистенции).

Математический аппарат

f = ; (1)

f = = d; (2)

f = ; (3)

f₁ = ; (4)

где f - коэффициент надежности; r - коэффициент корреляции между двумя частями теста (Пирсона или ранговый); S₁, S₂ - среднеквадратичные отклонения 1-й и 2-й половин теста, соответственно; S₁ = , S₂ = - дисперсии 1-й и 2-й половин теста, соответственно; п - количество заданий теста; d - символ для сокращения записи; f₁ - коэффициент консистенции; S - дисперсия всех задач теста; р - индекс трудности задачи в десятичной дроби (1/100); q = 1- р.

Значение коэффициента надежности теста редко превышает на практике 8.

Тест считается надежным при f > 6.

- Формула Спирмена-Брауна (1). Применяется, если дисперсии обеих частей теста равны. Это предположение проверяется с помощью критерия Фишера: F = S₁/S₂если эмпирическая статистика F превышает табличное значение F_t,то гипотезу о равенстве дисперсий следует отклонить. В данном случае при 21 степени свободы, для уровня значимости 0,05 F_t = 2,1.

- Формула Флангана (2). Применяется в случае неравенства дисперсий.

- Формула Кристофа (3). Применяется в случае малого количества заданий теста (п<50).

- Формула Кьюдера - Ричардсона (4). Частный случай формулы Кронбаха для дихотомических интерпретаций ответов «правильно-неправильно».

Порядок работы. Студентам предлагается тест «Домино», с которым они работали на прошлом занятии.

Обработка данных

1.Составляется таблица (табл. 10.3.1), где Х₁_i - количество правильно решенных задач i-м испытуемым - показатель успешности работы i-го испытуемого в 1-м тестировании; Х_2i-показатель успешности работы i-го испытуемого во 2-м; N - объем выборки испытуемых.

Таблица 10.3.1

Определение надежности методом «тест-ретест»

i X₁ X₂

…

N

Вычисляется коэффициент корреляции r (Х₁, X₂).

2. Задания теста (после повторного тестирования) разбиваются на четные и нечетные. Составляется таблица (табл. 10.3.2), где У_1i, У_2i - количество испытуемых, правильно решивших соответствующую задачу; п - количество задач.

Таблица 10.3.2

⇐ Назад
53
54
55
56
57
58
596061
62
63
64
65
66
67
68
Далее ⇒