ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ. F-критерий, критерий Фишера (F-test)

 


F-критерий, критерий Фишера (F-test)

F-распределение (F-distribution)

F-статистика (F-statistic)

t-критерий (t-test)

t-распределение (t-distribution)

U-критерий Манна-Уитни (Mann-Whitney U-test)

V-коэффициент Крамера (Cramer's V)

z-статистики ( z -test)

альтернативная гипотеза (alternative hypothesis)

асимметричная "лямбда" (asymmetric lambda)

асимметрия (skewness)

биномиальный критерий (binomial test)

вариационный ряд, распределение частот (frequency distribution)

выборочная (наблюдаемая) статистика, статистика критерия (test statistic)

гамма (gamma)

двусторонний критерий (two-tailed test)

двухвыборочный критерий согласия Колмогорова—Смирнова (Kolmogorov— Smirnov two-sample test)

двухвыборочный медианный критерий (two-sample median test)

дисперсия (variance)

коэффициент вариации (coefficient of variation)

коэффициент сопряженности признаков (contingency coefficient)

критерий знаков (sign test)

критерий попарных сравнений Уилкоксо­на (Wilcoxon matched-pairs signed-ranks test)

критерий серий (run test)

медиана (median)

межквартильный размах (interquartile range)

мода (mode)

мощность критерия (power of a test)

независимые выборки (independent samples)

непараметрические методы проверки ги­потез (nonparametric tests)

нулевая гипотеза (null hypothesis)

одновыборочный критерий согласия Колмогорова—Смирнова (Kolmogorov-Smirnov one-sample test)

односторонний критерий (one-tailed test)

ошибка I рода (type I error)

ошибки II рода (type II error)

параметрические методы проверки гипотез (parametric tests)

парные выборки (paired samples) парный t-критерий (paired samples t-test)

показатели вариации (measures of variability)

показатели центра распределения (measures of location)

построение таблицы сопряженности признаков, кросс-табуляция (cross-tabulation)

размах вариации (range)

распределение хи-квадрат (chi-square distribution)

симметричная "лямбда" (symmetric lambda)

средняя арифметическая, среднее (mean)

стандартное (среднеквадратическое) отклонение (standard deviation)

t-статистика (t-statistic)

статистика хи-квадрат (chi-square statistic)

таблица сопряженности признаrков (contingency table)

тау b (tau b )

тау с (tau с )

уровень значимости (level of significance)

фи-коэффициент (phi coefficient)

эксцесс (kurtosis)


 

УПРАЖНЕНИЯ

Вопросы

 

1. Опишите процедуру определения частот распределения значений переменной.

2. Какие показатели центра распределения обычно вычисляют?

3. Определите межквартильный размах. Что он измеряет?

4. Что означает коэффициент вариации?

5. Каким образом измеряют относительную плосковершинность или островершинность кри­вой распределения?

6. Что такое асимметричное распределение?

7. Чем отличается таблица распределения частот от таблицы сопряженности?

8. Какое общее правило вычисления процентов при кросс-табуляции?

9. Дайте определение ложной корреляции.

10. Что означает подавленная связь? Как ее выясняют?

11. Проанализируйте причины частого использования таблиц сопряженности. Каковы огра­ничения их применения?

12. Представьте классификацию методов проверки гипотез.

13. Опишите обычную процедуру для выполнения проверки гипотезы с помощью t-критерия.

14. Чем отличаются параметрические и непараметрические методы проверки гипотез?

15. Какие непараметрические критерии соответствуют t -критерию двух независимых выборок для параметрических данных?

16. Какие непараметрические критерии соответствуют t -критерию парных выборок для пара­метрических данных?

Задачи

 

1. Для каждой из следующих ситуаций укажите статистический анализ, который надо провес­ти, и подходящий для этого критерий или тест-статистику.

a) Потребители оценили свое предпочтение мыла Camay по И-балльной шкале Лайкерта. Затем они просмотрели коммерческую рекламу о мыле Camay. После этого предпочте­ния потребителей опять измерили. Изменила ли реклама предпочтения потребителей?

b) Подчиняются ли предпочтения относительно мыла Camay закону нормального распре­деления?

c) Маркетологи разбили одну тысячу семей на следующие группы, исходя из уровня по­требления мороженного: много, средне, мало и не употребляющие. Одновременно их разделили на семьи с высоким, средним и низким доходом. Зависит ли потребление мороженого от уровня дохода?

d) В исследовании, использующем репрезентативную выборку из 2000 домохозяйств из потребительской почтовой панели Market Facts, респондентов попросили проранжи-ровать 10 универмагов, включая универмаг Sears, в порядке предпочтения. Выборка была разделена на малые и большие семьи (по медиане). Варьируются ли предпочте­ния покупателей относительно покупки товаров в универмаге Sears в зависимости от размера семьи?

2. Текущую рекламную кампанию для известного прохладительного напитка следует изме­нить, если реклама понравится менее чем 30% потребителей.

a) Сформулируйте нулевую и альтернативную гипотезы.

b) Обсудите ошибки I и II рода, которые могут иметь место при проверке гипотез.

c) Какой статистический критерий вам следует использовать? Почему?

d) Была взята случайная выборка из 300 потребителей, и 84 респондента указали, что им понравилась рекламная кампания. Стоит ли вносить в рекламную кампанию корректи­ровку? Почему?

3. Сеть универмагов (10 магазинов) организовала распродажу холодильников. Количество проданных холодильников в выборке из десяти магазинов было такими: 80 110 0 40 70 80 100 50 80 30

a) Очевидно ли, что в среднем продано свыше 50 холодильников одним магазином в течение этой распродажи? Используйте а = 0,05 .

b) Какое допущение необходимо сделать для этой проверки?