Надежность-согласованность (синхронная, одномоментная надежность)

НАДЕЖНОСТЬ ТЕСТА

Надежность и точность

Надежность теста – характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию случайных посторонних факторов. Результат психологического исследования обычно подвержен действию большого количества неучтенных факторов. К ним относятся:

- эмоциональное состояние,

- утомление,

- уровень мотивации испытуемых.

- а также время проведения обследования, температура воздуха, освещенность и т.п. внешние факторы.

При обследовании с помощью теста группы испытуемых получаются разные результаты у отдельных испытуемых. Разброс результатов тестового обследования оценивается с помощью дисперсии. Эта дисперсия является результатом влияния двух причин:

1) изменчивости, присущей измеряемому свойству, т.е. это свойство выражено у разных испытуемых по-разному,

2) влияния случайных факторов, обуславливающих нестабильность измерительной процедуры.

Отсюда дисперсия результатов обследования находится так:

,

где Sx2 – эмпирическая дисперсия теста,

St2 – истинная дисперсия или дисперсия измеряемого свойства,

Se2 – дисперсия ошибки.

Надежность теста может быть оценена как отношение истинной дисперсии к эмпирической дисперсии:

,

 

,

 

,

 

– формула Рюлона.

 

Надежность целого теста

Различают два вида надежности теста:

1. Надежность-устойчивость (ретестовая, диахронная). Она характеризует устойчивость теста по отношению к факторам, изменяющимся во времени, иначе, стабильность результатов обследования во времени, применяется для оценки надежности тестов, предназначенных для измерения стабильных, устойчивых психологических качеств таких, например, как темперамент, ригидность, интеллект и т.п.

Она измеряется с помощью повторного тестирования той же самой выборки испытуемых, что и в первый раз. Обычно второе тестирование проводится через две недели после первого. В качестве показателя надежности используется коэффициент корреляции, который показывает тесноту связи между результатами первого и второго тестирования. Для интервальных шкал подсчитывается коэффициент линейной корреляции Пирсона. Для шкал порядка в качестве меры надежности используется коэффициент ранговой корреляции Спирмена. Чем выше полученный коэффициент корреляции, тем выше надежность теста. Обычно этот коэффициент корреляции составляет 0,7 – 0,8.

Зная данную величину корреляции, можно вычислить истинное значение тестового балла конкретного испытуемого:

Где Хti – истинный балл i-го испытуемого

Хi – эмпирический балл i-го испытуемого

r – эмпирически измеренная надежность теста

– среднее арифметическое по тесту.

.

Надежность-согласованность (синхронная, одномоментная надежность).

Она характеризует в какой мере согласованно дифференцируют испытуемых отдельные части теста. Она показывает устойчивость отдельных частей теста к воздействующим в данный момент случайным факторам.

Простейший способ оценки надежности-согласованности предполагает расщепление целого теста на 2 части, например, к первой части относятся четные пункты, ко второй – нечетные. По каждой половине рассчитываются суммарные баллы и между двумя рядами баллов по испытуемым рассчитывают коэффициент корреляции. Получается коэффициент, относящийся к половинам теста. Если суммарные баллы по двум половинам теста нормализованы, то рекомендуется использовать ранговую корреляцию. Для того чтобы найти надежность целого теста (r), пользуются формулой Спирмена – Брауна:

rxx – надежность целого теста,

rx – эмпирически рассчитанный коэффициент корреляции между двумя половинами теста.

Деление теста на две части может быть осуществлено разными способами, и каждый раз будут получаться несколько разные коэффициенты. Поэтому предлагается делить тест на столько частей, сколько в нем пунктов. Тогда надежность вычисляется по формуле Кронбаха:

α – коэффициент Кронбаха,

К – количество пунктов теста,

Sj2 – дисперсия по j-му пункту теста,

Sх2 – дисперсия суммарных баллов по всему тесту.

Данная формула используется, когда пункты теста предполагают ответы с использованием трех и более шаговых шкал.

Если ответы даются в дихотомической шкале, то используется формула Кьюдера – Ричардсона:

KR20 – коэффициент Кьюдера – Ричардсона – показатель надежности;

– дисперсия j-го пункта теста;

Pj – относительная доля правильных ответов (ответов «да») на j-й пункт теста:

n – количество испытуемых,

– количество ответов верно («да») на j-й пункт теста;

– относительная доля ответов неверно («нет») на j-й пункт теста.