Параметрический t-критерий Стьюдента

Лекция 9

Критерии различия

Параметрический t-критерий Стьюдента

На прошлой лекции было введено понятие статистического критерия, говорилось о параметрических и непараметрических критериях, служащих для проверки статистических гипотез, при решении различных задач. В сравнительных и лонгитюдных исследованиях наиболее популярна задача о различии двух выборочных средних, а также ряд сходных задач.

Для ее решения чаще всего применяется t-критерий Стьюдента (псевдоним В.Госсета). Критерий Стьюдента - это параметрический критерий различия, служащий для проверки гипотезы о достоверности или недостоверности различия между двумя средними значениями. Обычно он изучается в двух наиболее популярных вариантах - когда сравниваемые выборки независимы (не связаны) и когда они зависимы (связаны), т.е. состоят из попарно связанных вариант.

Поскольку критерий Стьюдента – параметрический критерий, он применяется для количественых данных, к тому же требуется распределение переменной, близкое к нормальному закону распределения. Напомним, что в изучаемых критериях используются данные с одной переменной (признаком), и в случае многомерных данных приходится применять критерий многократно.

В.Госсет нашел закон распределения величины , в которой генеральное стандартное отклонение s заменено на его выборочную оценку s. Оказалось, что распределение этого выражения весьма близко к нормальному уже при объеме выборки n = 30.

 

 

Идея измерения значимости различий в критерии естественна, он представляет собой меру различия, пропорциональную разности двух средних и обратно-пропорциональную ошибке репрезентативности разности средних.

t = ;

 

Рассмотрим рабочие формулы критерия для наиболее часто встречающихся случаев:

1. Вариант применения критерия Стьюдента для независимых (несвязанных) выборок, встречающийся в сравнительном исследовании.

В этом случае применяется формула:

t = = = ,

число степеней свободы определяется по формуле: df = nx + ny - 2

В случае, когда сравниваемые выборки равны по численности, то-есть при nx= ny = n формула преобразуется:

t =

Поясним, что обозначения x и y в формуле не означают двух различных переменных, это обозначения одной переменной, измеренной в двух различных выборках.

 

2. Вариант применения критерия Стьюдента для зависимых (связанных) выборок, встречающийся, к примеру, в лонгитюдном исследовании, когда сравниваются данные, полученные в одной группе.

 

tф= ,

где среднее различие значений в связанных парах данных,т.е. ,где di = xi - yi

df = n - 1; где n - число пар данных или, что то же, количество испытуемых в группе.

Пример:

Рассмотрим варианты применения критерия Стьюдента, в двух его вариантах. Измерялась импрессивная способность, то-есть способность распознавания эмоционального состояния по фотоизображению лиц с эмоциональной экспрессией. Эти данные измерены в группе испытуемых.

xi yi
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

А) Первоначально рассмотрим пример исходя предположения, что обследовались 2 различные группы, то-есть случай несвязанных выборок. Необходимо определить, достоверны ли различия выборочных средних в двух группах, принять или опровергнуть Ho. Таким образом, согласно условию, nx =10 и ny =10, df = nx + ny - 2 = 18

Расчеты показывают, что =40.1; = 38.6; Dx = 10,1; Dy=11,6:

t= =

и фактическое значение критерия равное 1.02 при граничных значениях, равных, соответственно t гр. (5%)=2.10 и t гр. (1%)=2.88 (см. рис. ).

 

 

 

 

 

Cтатистический вывод: поскольку фактическое значение критерия,

равное 1.02, меньше граничного значения критерия на 5% уровне значимости, равного 2.10, то принимается нулевая гипотеза H0, согласно которой нет статистически достоверных различий между двумя средними выборочными значениями = 40.1 и =38.6.

Психологический вывод: поскольку принимается нулевая гипотеза, не существует достоверных значений средних значений импрессивной способности в обеих группах.

 

 

Б) Теперь рассмотрим эти же данные, предположив, что они представляют два среза, полученных в одной группе.

 

 

xi yi di
11. -8 -9,5 90,25
12. 2,5 6,25
13. 2,5 6,25
14. 2,5 6,25
15. 1,5 2,25
16. 0,5 0,25
17. 0,5 0,25
18. 3,5 12,25
19. -1 -2,5 6,25
20. 0,5 0,25
å 130,5
среднее 40,1 38,6 =1,5

tф= = =1,25;df = n – 1 = 9,

t гр. (5%)=2.26 и t гр. (1%)=3.25 (см. рис. ).

 

Cтатистический вывод: поскольку фактическое значение t -критерия, равное 1.25, меньше граничного значения критерия на 5% уровне значимости, равного 2.26, то принимается нулевая гипотеза H0, согласно которой нет статистически достоверных различий между двумя выборочными средними значениями.

Психологический вывод: поскольку принимается нулевая гипотеза, не обнаружено достоверных значений двух средних значений импрессивной способности, измеренных в одной группе.

 

3 Оценка достоверности различий выборочной средней и генеральной средней.

В некоторых случаях значение генеральной средней m известно, например, оно может быть получено в процессе стандартизации психодиагностического теста с помощью весьма большой по объему, в несколько тысяч испытуемых, выборки стандартизации. В ходе проведения выборочного исследования с помощью этого теста может возникнуть проблема сравнения генерального параметра m и выборочной оценки х.

Для этой цели используется формула:

,

где в знаменателе ошибка репрезентативности для

генерального среднего, а df =n-1, где n – объем выборки.

 

К примеру, в тесте, измеряющем уровень умственного развития Векслера, значение генерального среднего m=100. Допустим, на выборке в 25 человек получено выборочное среднее =115 и стандартное отклонение s=15. Достоверно ли отличие генерального среднего и выборочного? С помощью критерия Стьюдента можно ответить на этот вопрос.

 

В нашем случае:

= = =5,00, df =n-1=24

Статистический вывод:

Поскольку фактическое значение критерия равно 5.0 и больше граничных значений и на 5%, и на 1% уровнях значимости, принимается альтернативная гипотеза H1, согласно которой существует статистически достоверное различие между генеральной средней m=100 и нашей выборочной средней, равной 115.

Психологический вывод:

поскольку принимается Н0, можно говорить о статистически достоверном различии между выборочным значением уровня интеллекта и генеральным средним для этой переменной.

 

 

Вопросы и упражнения:

 

1. Какую роль оказывает дисперсии переменных в обеих группах на значение t -критерия Стьюдента.

2. Почему t -критерий Стьюдента является параметрическим критерием?

3. Какое количество различных переменных входят в формулу критерия Стьюдента.

4. Рассчитать значение t-критерия Стьюдента для данных, приведенных в таблице, полученных при измерении личностной тревожности с помощью теста Тейлор.

Провести расчеты в двух вариантах исходя из следуюющих предположений:

А) данные получены для двух независимых выборок по 13 человек в каждой.

Б) данные получены для двух зависимых выборок, относятся к двум срезам

X У

Рассчитать значения t-критерия Стьюдента, принять одну из двух статистических гипотез, сделать статистический и психологический выводы.

Ответы:

А) Для независимых выборок:

= 19.38; =22.62; s.=9.50; s=7.94; Dx = 90.25; Dy=63.04.

Значение t-критерия Стьюдента t=0.94, принимается Н0.

 

Б) для зависимых выборок:

Значение t-критерия Стьюдента t=3.71, принимается Н1.