Непараметрический анализ
Использование непараметрической статистики, как уже было отмечено выше (см. параграф 2.2), может оказаться весьма оправданным в случаях, когда характер распределения исследуемых данных в значительной степени отличается от того, что предполагает структурная модель, применяемая при их параметрическом анализе. Ранее была рассмотрена стратегия действий исследователя, использующего для сравнения двух средних широко применяемый для этих целей t-тест Стьюдента. Не имея возможности объединить дисперсии двух групп данных, исследователь строит статистику t', которая оказывается в значительной степени подобной статистике t. Фактически статистика t' совпадает со статистикой t лишь в том случае, когда дисперсии двух рядов данных совпадают. Чем больше различаются дисперсии в двух группах, тем в большей мере распределение t' отличается от распределения Стьюдента и таким образом увеличивается опасность совершить ошибку первого рода, или α-ошибку, которая, напомним, состоит в том, что нулевая гипотеза отвергается при условии, что она на самом деле верна. Возможным выходом из этой ситуации является использование более консервативной стратегии оценки нулевой гипотезы. В описанном выше случае это предполагало вычисление степеней свободы для статистики t по специальным формулам. Чем больше различаются дисперсии в двух выборках, тем меньшим оказывается вычисляемое по этим формулам число степеней свободы статистики t' по сравнению с тем, что было бы получено при оценке степеней свободы в соответствии со стандартными процедурами ί-теста Стьюдента.
Другим способом более консервативных действий исследователя в рассматриваемой ситуации было бы использование непараметрических аналогов теста Стьюдента. Такими аналогами ί-теста Стьюдента считаются критерий знаков, W-критерий Уилкоксона (или критерий знаковых рангов Уилкоксона), а также U-критерий Манна – Уитни. Первые два теста используются в ситуации, когда сравниваемые выборки являются связными, т.е., например, когда оба ряда данных относятся к одной и той же группе испытуемых. Иными словами, это аналоги ί-теста для зависимых выборок. В случае, когда две выборки данных являются полностью независимыми, применяется U-критерий Манна –Уитни; таким образом, он оказывается полным аналогом того варианта ί-теста, который используется, когда все данные оказываются статистически независимыми.
U-критерий Манна – Уитни – наиболее популярный среди непараметрических критериев для двух независимых выборок. Этот тест проверяет гипотезу о том, что две генеральные совокупности, из которых были отобраны выборки, эквивалентны по расположению. Наблюдения из обеих групп объединяются и ранжируются, причем совпадающим значениям назначается средний ранг. Число совпадающих значений должно быть мало по сравнению с общим количеством наблюдений. Если проверяемые совокупности оказываются эквивалентными по расположению, то, очевидно, ранги должны распределяться между двумя выборками случайным образом. При расчете критерия подсчитывается, сколько раз значение из одной выборки данных предшествует значению из другой выборки, а также сколько раз значение из второй группы предшествует значению из первой группы. Для расчета значения {/-статистики Манна – Уитни выбирают наименьшее из этих двух чисел. Статистическая надежность полученного результата оценивается по специально разработанному алгоритму.
Критерий знаков рассчитывает разности между двумя переменными для всех наблюдений и классифицирует их как положительные, отрицательные или совпадения (нулевые). Если обе переменные распределены одинаково, то число положительных и отрицательных разностей, очевидно, не должно значимо различаться.
W-критерий знаковых рангов Уилкоксона, в отличие от критерия знаков, учитывает информацию не только о знаке разности между парами данных, но также и о величине этой разности. Таким образом, критерий Уилкоксона, учитывает больше информации о данных и оказывается более мощным, чем критерий знаков. Поэтому его использование является предпочтительным по сравнению с критерием знаков.
Непараметрический анализ данных оказывается более надежным, если исследуемые выборки включают в себя достаточно большое число значений. Если исследуемые выборки малы, скажем, включают в себя по 10–15 наблюдений, надежность результатов непараметрических тестов оказывается не слишком высокой. Если же выборки оказываются достаточно большими, расчеты вручную будут довольно утомительными. Поэтому необходимые расчеты лучше выполнять с помощью компьютера. Как правило, пакеты статистического анализа содержат необходимые для этого модули. Так, в последних версиях статистического пакета IBM SPSS Statistics такой анализ можно осуществить практически в автоматическом режиме, даже не задумываясь о самом выборе варианта непараметрического критерия.