Сравнение более 2-х зависимых выборок

Критерий χ2

Фридмана и коэффициент конкордации (согласия) Кендалла

χ2

Фридмана - это непараметрическая альтернатива однофакторному дисперсионному анализу

с повторными измерениями (ANOVA).

Коэффициент конкордации (согласия) Кендалла - аналог R Спирмена (непараметрический

коэффициент корреляции между двумя переменными), когда число переменных больше двух.

Критерий χ2 Фридмана может быть более эффективен, чем его метрический аналог ANOVA в

случаях повторных измерений изучаемого признака на небольших выборках.

Критерий χ2 Фридмана основан на ранжировании ряда повторных измерений для каждого

объекта выборки. Затем вычисляется сумма рангов для каждого из условий (повторных

измерений). Если выполняется статистическая гипотеза об отсутствии различий между

повторными измерениями, то можно ожидать примерное равенство сумм рангов для этих

условий. Чем больше различаются зависимые выборки по изучаемому признаку, тем больше

эмпирическое значение критерия Фридмана.

Тема 12. Методы сравнения номинальных данных

Глава 2. Методы проверки статистических гипотез. Корреляции и методы

Сравнения.

χ2

Пирсона (Chi-square или хи-квадрат Пирсона) или критерий согласия

Данный метод сравнения используется, если Ваши данные измерены в номинальной шкале и

имеют две и более градации. Однако, это не означает, что если ваши данные представлены в

других шкалах, то этот метод использовать нельзя.

При сопоставлении нескольких градаций чаще всего проверяют гипотезу о том, различаются ли

по численности соответствующие доли совокупности.

Таким образом, при выявлении достоверных различий, можно сделать вывод о том, что

распределение предпочтений является неравномерным. Однако, при использовании более двух

градаций, мы не можем утверждать о том, что в какой-то конкретной ячейке наблюдений

больше, а в какой-то меньше. Для того, чтобы выявить в какой ячейке больше, а в какой меньше

наблюдений, необходимо воспользоваться дополнительной статистической проверкой.

Это касается не только данного метода сравнения. При использовании любых методов

множественных сравнений (например, ANOVA Краскела-Уоллиса, χ2

Фридмана__________) для

конкретизации полученных результатов (подтвердилась гипотеза о не тождественности

результатов) необходимо использовать парные сравнения величин.

Распределение вероятных значений случайной величины χ2

непрерывно и ассиметрично. Оно

зависит от числа степеней свободы и приближается к нормальному распределению по мере

увеличения числа наблюдений.

Поэтому применение критерия χ2

к оценке дискретных распределений сопряжено с

некоторыми погрешностями, которые сказываются на его величине, особенно на

малочисленных выборках. Для получения более точных оценок выборка, распределяемая в

вариационный ряд, должна иметь не мене 50 вариант.

Таблицы сопряженности

Таблицы сопряженности или кросстабуляция - это процесс объединения двух (или нескольких)

таблиц частот так, что каждая ячейка в построенной таблице представляется единственной

комбинацией значений или уровней табулированных переменных.

Каждая ячейка таблицы сопряженности содержит информацию о количестве объектов,

попадающих в группу, определенную комбинацией двух значений. В применении к анализу

опросных листов это означает, что исследователь может, например, получить информацию о

количестве мужчин, имеющих информацию о товаре (количество человек, ответивших на

вопрос о поле – "муж.", и на вопрос о известности товара – "известен").

Обычно используются категориальные или номинальные переменные или переменные с

относительно небольшим числом значений. Если вы хотите табулировать непрерывную

переменную (например, доход), то вначале ее следует перекодировать, разбив диапазон

изменения на небольшое число интервалов (например, доход: низкий, средний, высокий).

Простейшая форма кросстабуляции - это таблица сопряженности 2x2, в которой значения двух

переменных "пересечены" (сопряжены) на разных уровнях и каждая переменная принимает

только два значения, т.е. имеет два уровня.

Результатом данного метода являются следующие показатели:

1) χ2

Пирсона - это наиболее простой критерий проверки значимости связи между двумя

категоризованными переменными. Критерий Пирсона основывается на том, что в двувходовой

таблице ожидаемые частоты при гипотезе "между переменными нет зависимости" можно

вычислить непосредственно.

2) Йетса χ2

. Аппроксимация статистики χ2

для таблиц 2x2 с малыми числом наблюдений в

ячейках может быть улучшена уменьшением абсолютного значения разностей между

ожидаемыми и наблюдаемыми частотами на величину 0,5 перед возведением в квадрат (это и

есть поправка Йетса). Поправка Йетса, делающая оценку более умеренной, обычно

применяется в тех случаях, когда таблицы содержат только малые частоты, например, когда

некоторые ожидаемые частоты становятся меньше 10.

3) Точный критерий Фишера (критерий Фишера-Ирвина, точный метод Фишера). Этот

критерий применим только для таблиц 2x2. Критерий основан на следующем рассуждении.

Даны маргинальные частоты в таблице (частоты, расположенные по краям таблицы),

предположим, что обе табулированные переменные независимы. Зададимся вопросом: какова

вероятность получения наблюдаемых в таблице частот, исходя из заданных маргинальных?

Таким образом, критерий Фишера вычисляет точную вероятность появления наблюдаемых

частот при нулевой гипотезе (отсутствие связи между табулированными переменными). В

таблице результатов приводятся как односторонние, так и двусторонние уровни.

4) Фи-квадрат представляет собой меру связи между двумя переменными в таблице 2x2. Его

значения изменяются от 0 (нет зависимости между переменными; χ2

= 0.0) до 1 (абсолютная

зависимость между двумя факторами в таблице).

5) χ2

Макнимара применяется, когда частоты в таблице 2x2 представляют зависимые выборки.

Например, наблюдения одних и тех же индивидуумов до и после эксперимента. Вычисляются

два значения χ2

: A/D и B/C. A/D χ2

проверяет гипотезу о том, что частоты в ячейках A и D

(верхняя левая, нижняя правая) одинаковы. B/C χ2

проверяет гипотезу о равенстве частот в

ячейках B и C (верхняя правая, нижняя левая).

Хотелось бы отметить, если Вам необходимо просто сравнить наблюдения в двух группах, то

проще всего это сделать в программе Statistica, но если Вам необходимо провести более

сложные сравнения, например, исследование влияние расы на количество детей в семье и

времени обучения в средней школе, тогда Вам необходимо использовать программу SPSS.

Q-критерий Кохрена

Q-критерий Кохрена – это развитие критерия χ2

Макнемара. Критерий проверяет, значимо или

нет различаются между собой несколько сравниваемых переменных, принимающих значения 0-1.