Примеры для самостоятельного решения. Пример 1. В продовольственном магазине проведены контрольные взвешивания проданной колбасы
Пример 1. В продовольственном магазине проведены контрольные взвешивания проданной колбасы. Полученные данные указаны в таблице:
недовес, г | |||||||||
частота |
Определить с помощью λ – критерия Колмогорова-Смирнова на уровне значимости α = 0,05, согласуются ли данные выборки с равномерным распределением на отрезке [0,10].
Ответ:данные выборки согласуются с равномерным распределением на отрезке [0,10].
Пример 2. В таблице указаны результаты проверки по недовесам покупателям одного вида овощей:
Интервалы недовесов, г | Частота (выборка 1) | Частота (выборка 2) |
0 – 10 | ||
10 – 20 | ||
20 – 30 | ||
30 – 40 | ||
40 – 50 | ||
50 – 60 | ||
60 – 70 | ||
70 – 80 | ||
80 – 90 |
Уровень значимости α = 0,05. Проверить гипотезу о том, что недовесы овощей определяются одним и тем же законом распределения.
Ответ: λэмп =0,559; λкр=1,358. принимается.
Пример 3. В таблице указаны результаты проверки по недовесам покупателям одного вида овощей:
Интервалы недовесов, г | Частота (выборка 1) | Частота (выборка 2) |
0 – 10 | ||
10 – 20 | ||
20 – 30 | ||
30 – 40 | ||
40 – 50 | ||
50 – 60 | ||
60 – 70 | ||
70 – 80 | ||
80 – 90 |
Уровень значимости α = 0,05. Проверить гипотезу о том, что недовесы овощей определяются одним и тем же законом распределения.
Ответ: принимается.
Пример 4. 100 избирателям предложили распределить 9 кандидатов в депутаты по 9 позициям в порядке предпочтения. Эмпирические частоты попадания депутата Иванова на каждую из 9 позиций представлены в таблице:
Эмпирические частоты | Позиции депутата Иванова |
Можно ли утверждать, что распределение голосов за депутата Иванова по 9 позициям не отличается от равномерного распределения ( ). Уровень значимости α=0,05.
Ответ:λэмп = 1,8; λкр = 1,358. отвергается.
Пример 5. 2 группы студентов сдают зачет по 10-ти балльной системе. 1 группа готовилась к зачету по лекциям, 2 группа – по учебникам. Проверить гипотезу о том, что распределение оценок в 1 и 2 группах одинаково. Уровень значимости α=0,05.
1).
оценки | ||||||||||
гр 1 | ||||||||||
гр 2 |
Ответ:λэмп = 1,4; λкр = 1,358. отвергается.
2).
оценки | ||||||||||
гр 1 | ||||||||||
гр 2 |
Ответ:λэмп =0,7; λкр = 1,358. принимается.
3).
оценки | ||||||||||
гр 1 | ||||||||||
гр 2 |
Ответ:λэмп =0,6; λкр = 1,358. принимается.
4).
оценки | ||||||||||
гр 1 | ||||||||||
гр 2 |
Ответ:λэмп =0,4; λкр = 1,358. принимается.
5).
оценки | ||||||||||
гр 1 | ||||||||||
гр 2 |
Ответ:λэмп =0,4; λкр = 1,358. принимается.
Критерий Пирсона
Назначение критерия. Критерий χ2 применяется в двух случаях:
1) при сопоставлении эмпирического распределения признака с теоретическим, чаще всего с нормальным распределением;
2) при сопоставлении двух, трех и более эмпирических распределений одного и того же признака.
В настоящем пособии мы рассматриваем применение χ2 – критерия для второго из перечисленных выше случаев, т.к. пособие посвящено непараметрическим критериям, а их применение не требует распределение признака по нормальному закону.
Ограничения критерия.
Объем выборки должен быть достаточно большим – n ≥ 30. При n < 30 критерий χ2 дает приближенные значения. Точность критерия повышается при больших n.
Гипотезы. Возможны несколько вариантов гипотез в зависимости от задач, которые решает исследователь.
1) : эмпирическое распределение 1 не отличается от эмпирического распределения 2;
: эмпирическое распределение 1 отличается от эмпирического распределения 2.
2) : нет связи между значениями двух признаков;
: есть связь между значениями двух признаков.
Описание подсчета χ2 – критерия.
Будем проверять гипотезу о наличии связи между значениями двух величин. : нет связи между значениями двух величин.
: есть связь между значениями двух величин.
Описание подсчета χ2 – критерия приведем на примере.
Пример. Студенты сдавали экзамены по математике и физике. Есть ли связь между результатами экзаменов? Ниже представлена таблица наблюдаемых частот fо.
Результаты экзаменов по математике | Результаты экзаменов по физике | |||
Пять | Четыре | Три | Два | |
Пять | ||||
Четыре | ||||
Три | ||||
Два |
Решение. В клетке 1,1 (первая строка, первый столбец) стоит число 25, т.е. 25 студентов получили и по физике и по математике одинаковые оценки. В клетке 4,2 (4 строка, 2 столбец) указано число 10, т.е. 10 студентов получили хорошие оценки по физике и неудовлетворительные по математике, и т.д.
: нет связи между оценками по физике и математике;
: есть связь между оценками по физике и математике.
Построим таблицу ожидаемых частот fe. Сначала суммируем числа по строкам и столбцам предыдущей таблицы:
Результаты экзаменов по математике | Результаты экзаменов по физике | Сумма | |||
Пять | Четыре | Три | Два | ||
Пять | |||||
Четыре | |||||
Три | |||||
Два | |||||
Сумма |
Получены результаты экзаменов у 225 студентов (n=225). Отличный результат по математике показали 58 студентов, т.е. доля тех, кто получил отличные оценки по математике, равна 58/225. Если верна гипотеза , то можно ожидать, что 58/225 из 68 студентов, получивших отличные оценки по физике, показали отличные знания и по математике. Аналогично можно рассчитать и другие ожидаемые частоты:
Результаты | Результаты экзаменов по физике | Сумма | |||
Пять | Четыре | Три | Два | ||
Пять | 68∙58/225 | 64∙58/225 | 54∙58/225 | 39∙58/225 | |
Четыре | 68∙57/225 | 64∙57/225 | 54∙57/225 | 39∙57/225 | |
Три | 68∙70/225 | 64∙70/225 | 54∙70/225 | 39∙70/225 | |
Два | 68∙40/225 | 64∙40/225 | 54∙40/225 | 39∙40/225 | |
Сумма |
Если в какой-то клетке получилось значение меньше 5, то нужно объединить какие-то строки или столбцы. Ожидаемые частоты нельзя округлять до целого значения.
Итак, получена таблица:
Результаты экзаменов по математике | Результаты экзаменов по физике | Сумма | |||
Пять | Четыре | Три | Два | ||
Пять | 17,5 | 16,5 | 13,9 | 10,1 | |
Четыре | 17,2 | 16,2 | 13,7 | 9,9 | |
Три | 21,2 | 19,9 | 16,8 | 12,1 | |
Два | 12,1 | 11,4 | 9,6 | 6,9 | |
Сумма |
Уровень значимости α=0,05, m=[(число строк таблицы – 1)∙(число столбцов таблицы –1)]=(4-1)∙(4-1) = 9. Для α и m по таблице χ2 – распределения (таблица VI приложения) найдем χ2кр = 16,92.
Замечание 1. Для нахождения χ2кр можно также воспользоваться статистической функцией ХИ20БР(α; m) мастера функций fx пакета Excel.
Теперь найдем значение статистического критерия χ2. Для этого заполним таблицу А, поясним, как это сделать. Наблюдаемые частоты fо пишем в первом столбце, а соответствующие им ожидаемые частоты fе – во втором столбце. Третий столбец таблицы заполняется разностями (fо - fе), четвертый – квадратами этих разностей. В пятом столбце – значения, вычисленные по формуле . Последняя строка таблицы – сумма чисел в каждом столбце. Сумма чисел пятого столбца – это и есть эмпирическое значение χ2 – критерия:
χ2эмп = ∑ = 24,40.
Если χ2эмп > χ2теор, то гипотеза отклоняется. Есть связь между оценками по математике и физике.
Таблица А
fo | fe | fo - fe | (fo - fe)2 | (fo - fe)2 ∕ fe |
17,5 | 7,5 | 56,25 | 3,21 | |
17,2 | 2,8 | 7,84 | 0,46 | |
21,2 | -6,2 | 38,44 | 1,81 | |
12,1 | -4,1 | 16,81 | 1,39 | |
16,5 | 1,5 | 2,25 | 0,14 | |
16,2 | -0,2 | 0,04 | 0,00 | |
19,9 | 0,1 | 0,01 | 0,00 | |
11,4 | -1,4 | 1,96 | 0,17 | |
13,9 | -3,9 | 15,21 | 1,09 | |
13,7 | 1,3 | 1,69 | 0,12 | |
16,8 | 5,2 | 27,04 | 1,61 | |
9,6 | -2,6 | 6,76 | 0,70 | |
10,1 | -5,1 | 26,01 | 2,58 | |
9,9 | -3,9 | 15,21 | 1,54 | |
12,1 | 0,9 | 0,81 | 0,07 | |
6,9 | 8,1 | 65,61 | 9,51 | |
Сумма | - | - | 24,40 |
Замечание 2. Вместо заполнения последней таблицы можно воспользоваться статистической функцией ХИ2ТЕСТ мастера функций пакета Excel. fx → статистические → Х2ТЕСТ → о,к. Появляется диалоговое окно. В графе «фактический интервал» указывается ссылка на ячейки, в которых хранятся наблюдаемые частоты. В графе «ожидаемый интервал» указывается ссылка на ячейки, в которых хранятся ожидаемые частоты. О,к. Если полученное значение превышает заданный уровень значимости α, то гипотеза отклоняется.