Статистический критерий - это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н0. 2 страница

Решение.Для решения данной задачи необходимо сравнить две средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых известны (большие независимые выборки). В данной задаче речь идет о больших выборках, так как nx = 42 и ny = 35 больше 30. Выборки - независимые, так как из контекста задачи видно, что они извлечены из непересекающихся генеральных совокупностей.

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0: = - генеральные средние двух нормально распределенных совокупностей с известными дисперсиями равны (применительно к условию данной задачи - предприятия двух групп относятся к одному типу предприятий, - средняя производительность труда в двух группах - одинакова).

Н1: ¹ - генеральные средние двух нормально распределенных совокупностей с известными дисперсиями не равны (применительно к условию данной задачи - предприятия двух групп относятся к разному типу предприятий, - средняя производительность труда в двух группах - неодинакова).

Выдвигаем двустороннюю конкурирующую гипотезу, так как из условия задачи не следует, что необходимо выяснить больше или меньше производительность труда в одной из групп предприятий по сравнению с другой.

Так как конкурирующая гипотеза - двусторонняя, то и критическая область - двусторонняя.

В качестве критерия для сравнения двух средних генеральных совокупностей, дисперсии которых известны (большие независимые выборки), используется случайная величина Z.

Его наблюдаемое значение (zнабл.) рассчитывается по формуле:

, (8.5)

где - выборочная средняя для X;

- выборочная средняя для Y;

D(X) - генеральная дисперсия для X;

D(Y) - генеральная дисперсия для Y;

nx - объем выборки для X;

ny - объем выборки для Y.

Найдем наблюдаемое значение (zнабл.):

Так как конкурирующая гипотеза - двусторонняя, критическое значение (zкр.) следует находить по таблице функции Лапласа (приложение 2) из равенства:

Ф0(zкр ) = (1 - a) / 2.

По условию a = 0,05.

Отсюда:

Ф0(zкр ) = (1 - 0,05) / 2 = 0,475.

По таблице функции Лапласа (приложение 2) найдем при каком zкр. Ф0(zкр ) = 0,475.

F0(1,96) = 0,475.

Учитывая, что конкурирующая гипотеза - двусторонняя, находим две критические точки:

zкр.(прав.) = 1,96; zкр.(лев.) = - 1,96.

Заметим, что при левосторонней конкурирующей гипотезе Н1: < zкр. следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(zкр ) = (1 - 2a) / 2 и присваивать ему "минус".

При правосторонней конкурирующей гипотезе Н1: > zкр. следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(zкр ) = (1 - 2a) / 2).

zнабл. > zкр, следовательно, на данном уровне значимости нулевая гипотеза отвергается в пользу конкурирующей. На уровне значимости a = 0,05 можно утверждать, что полученное различие средних показателей производительности труда в группах - неслучайно, имеются два типа предприятий с различной средней величиной производительности труда.

 
 

 


Критическая Область допустимых Критическая

область значений область

 

Z

 

-zкр. = -1,96 0 zкр.= 1,96 zнабл.= 4,565

Рис. 8.6.

Наблюдаемое значение критерия попадает в критическую область, следовательно, нулевая гипотеза отвергается в пользу конкурирующей.

Ответ. На уровне значимости a = 0,05 можно утверждать, что полученное различие средних показателей производительности труда в группах - неслучайно, имеются два типа предприятий с различной средней величиной производительности труда.

 

Пример 8.6 Предполагается, что применение нового типа резца сократит время обработки некоторой детали. Хронометраж времени обработки 9 деталей, обработанных старым типом резцов, дал следующие результаты: среднее время обработки детали составило 57 мин., исправленная выборочная дисперсия = 186,2 (мин.2). Среднее время обработки 15 деталей, обработанных новым типом резца, по данным хронометражных измерений составило 52 мин., а исправленная выборочная дисперсия = 166,4 (мин.2). На уровне значимости a = 0,01 ответьте на вопрос, позволило ли использование нового типа резцов сократить время обработки детали?

Решение.Для решения данной задачи необходимо сравнить две средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых неизвестны, но предполагаются одинаковыми (малые независимые выборки). В данной задаче речь идет о малых выборках, так как nx = 9 и ny = 15 меньше 30. Выборки - независимые, так как из контекста задачи видно, что они извлечены из непересекающихся генеральных совокупностей.

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0: = - генеральные средние двух нормально распределенных совокупностей с неизвестными дисперсиями (но предполагаемыми одинаковыми) равны (применительно к условию данной задачи - среднее время, затрачиваемое на обработку детали резцами нового и старого типа - одинаково, т.е. использование нового типа резца не позволяет снизить время на обработку детали).

Н1: > - генеральная средняя для Х больше, чем генеральная средняя для Y (применительно к условию данной задачи - среднее время, затрачиваемое на обработку детали резцами старого типа больше, чем - нового, т.е. использование нового типа резца позволяет снизить время на обработку детали).

Так как конкурирующая гипотеза - правосторонняя, то и критическая область - правосторонняя.

Приступать к проверке гипотезы о равенстве генеральных средних двух нормально распределенных совокупностей с неизвестными дисперсиями можно лишь в том случае, если генеральные дисперсии равны. В противном случае, данная задача в теории неразрешима.

Поэтому, прежде чем проверять эту гипотезу, проверим гипотезу о равенстве генеральных дисперсий нормальных совокупностей.

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0: D(X) = D(Y) - генеральные дисперсии двух нормально распределенных совокупностей равны.

Н1: D(X) > D(Y) - генеральная дисперсия для X больше генеральной дисперсии для Y. Выдвигаем правостороннюю конкурирующую гипотезу, так как исправленная выборочная дисперсия для Х значительно больше, чем исправленная выборочная дисперсия для Y.

Так как конкурирующая гипотеза - правосторонняя, то и критическая область - правосторонняя.

В качестве критерия для сравнения двух дисперсий нормальных генеральных совокупностей используется случайная величина F - критерий Фишера-Снедекора.

Его наблюдаемое значение (fнабл.) рассчитывается по формуле:

, (8.6)

где - большая (по величине) исправленная выборочная дисперсия;

- меньшая (по величине) исправленная выборочная дисперсия.

 

Найдем fнабл.:

.

Критическое значение (fкр.) следует находить по таблице распределения Фишера-Снедекора (приложение 6) по уровню значимости a и числу степеней свободы k1 и k2.

По условию a = 0,01; число степеней свободы найдем по формуле:

k1 = n1 - 1; k2 = n2 - 1,

где k1 - число степеней свободы большей (по величине) исправленной дисперсии;

k2 - число степеней свободы меньшей (по величине) исправленной дисперсии;

n1 - объем выборки большей (по величине) исправленной дисперсии;

n2 - объем выборки меньшей (по величине) исправленной дисперсии.

Найдем k1 и k2:

k1 = 10 - 1 = 8;

k2 = 15 - 1 = 14.

Определяем fкр. по уровню значимости a = 0,01 и числу степеней свободы k1=9 и k2=14:

fнабл. < fкр, следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу о равенстве генеральных дисперсий нормальных совокупностей.

Следовательно, можно приступить к проверке гипотезы о равенстве генеральных средних двух нормально распределенных совокупностей.

В качестве критерия для проверки этой гипотезы, используется случайная величина t - критерий Стьюдента:

Его наблюдаемое значение (tнабл.) рассчитывается по формуле:

, (8.7)

где - выборочная средняя для X;

- выборочная средняя для Y;

D(X) - генеральная дисперсия для X;

D(Y) - генеральная дисперсия для Y;

nx - объем выборки для X;

ny - объем выборки для Y.

Найдем tнабл.:

.

Критическое значение (tкр.) следует находить по таблице распределения Стьюдента (приложение 5) по уровню значимости a и числу степеней свободы k.

По условию a = 0,01; число степеней свободы найдем по формуле:

k = nx + ny - 2,

где k - число степеней свободы;

nx - объем выборки для X;

ny - объем выборки для Y.

k = 9 + 15 - 2 = 22.

Найдем tкр. по уровню значимости a = 0,01 (для односторонней критической области) и числу степеней свободы k = 22:

Заметим, что при левосторонней конкурирующей гипотезе < tкр. следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимости a (для односторонней критической области) и числу степеней свободы k = nx + ny - 2 и присваивать ему "минус";

При двусторонней конкурирующей гипотезе ¹ tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимости a (для двусторонней критической области) и числу степеней свободы k = nx + ny - 2).

tнабл. < tкр, следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу. По имеющимся хронометрическим данным на уровне значимости a = 0,01 нельзя отклонить гипотезу о том, что генеральные средние равны, т.е. среднее время, затрачиваемое на обработку детали старым и новым типом резцов отличается незначимо, расхождения между средними - случайны, использование нового типа резцов не позволяет снизить время обработки детали.

 
 

 


Область допустимых Критическая

значений область

 

T

 

0 tнабл.= 0,9 tкр.= 2,51

 

Рис 8.7.

Наблюдаемое значение критерия попадает в область допустимых значений, следовательно, нулевую гипотезу нельзя отвергнуть.

Ответ. На уровне значимости a = 0,01 нельзя утверждать, что использование нового типа резцов позволило сократить время обработки детали.

Пример 8.7 Партия изделий принимается в том случае, если вероятность того, что изделие окажется соответствующим стандарту, составляет не менее 0,97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости a = 0,02 принять партию?

Решение.Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная доля точно равна определенному числу.

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0: р = р0 = 0,97 - неизвестная генеральная доля р равна р0 (применительно к условию данной задачи - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, равна 0,97; то есть партию изделий можно принять).

Н1: р < 0,97 - неизвестная вероятность р меньше гипотетической вероятности р0 (применительно к условию данной задачи - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0,97; то есть партию изделий нельзя принять).

Так как конкурирующая гипотеза - левосторонняя, то и критическая область - левосторонняя.

В качестве критерия для сравнения наблюдаемой относительной частоты с гипотетической вероятностью появления события используется случайная величина U:

Его наблюдаемое значение (uнабл.) рассчитывается по формуле:

, (8.8)

где m / n - относительная частота (частость) появления события;

р0 - гипотетическая вероятность появления события;

q0 - гипотетическая вероятность непоявления события;

n - объем выборки.

По условию: m = 193; n = 200; p0 = 0,97; q0 = 1 - p0 = 0,03; a = 0,02.

Найдем наблюдаемое значение (uнабл.):

Так как конкурирующая гипотеза - левосторонняя, то критическое значение (uкр.) следует находить по таблице функции Лапласа (приложение 2) из равенства:

Ф0(uкр ) = (1 - 2a) / 2.

По условию a = 0,02.

Отсюда:

Ф0(uкр ) = (1 - 2 · 0,02) / 2 = 0,48.

По таблице функции Лапласа (приложение 2) найдем при каком uкр. Ф0(uкр ) = 0,48.

F0(2,05) = 0,48.

Учитывая, что конкурирующая гипотеза - левосторонняя, критическому значению необходимо присвоить знак "минус".

Следовательно: uкр. = - 2,05.

Заметим, что при правосторонней конкурирующей гипотезе Н1: р > 0,97 uкр. следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(uкр ) = (1 - 2a) / 2.

При двусторонней конкурирующей гипотезе Н1: p ¹ 0,97 uкр. следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(uкр ) = (1 - a) / 2).

uнабл. > uкр, следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу. По имеющимся данным на уровне значимости a = 0,02 нельзя отклонить гипотезу о том, что вероятность того, что изделие окажется соответствующим стандарту, составляет 0,97. Следовательно, партию изделий принять можно.

 
 

 


Критическая Область допустимых

область значений

 

U

-uкр.= - 2,05 uнабл. = - 0,28 0

Рис.8.8.

Наблюдаемое значение критерия попадает в область допустимых значений, следовательно, нет оснований отклонить нулевую гипотезу.

Ответ. На уровне значимости a = 0,02 партию изделий принять можно.

 

Пример 8.8 Два завода изготавливают однотипные детали. Для оценки их качества извлечены выборки из продукции этих заводов и получены следующие результаты:

 

  Завод №1 Завод №2
Объем выборки n1 n2
Число бракованных деталей m1 m2

 

На уровне значимости a = 0,025 определите, имеется ли существенное различие в качестве изготавливаемых этими заводами деталей?

Решение.Для решения данной задачи необходимо сравнить две вероятности биномиальных распределений.

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0: р1 = р2 - вероятности появления события в двух генеральных совокупностях, имеющих биномиальное распределение, равны (применительно к условию данной задачи - вероятность того, что деталь изготовленная на первом заводе, окажется бракованной, равна вероятности того, что деталь изготовленная на втором заводе, окажется бракованной).

Н1: р1 ¹ р2 - вероятности появления события в двух генеральных совокупностях, имеющих биномиальное распределение, не равны (применительно к условию данной задачи - вероятность того, что деталь изготовленная на первом заводе, окажется бракованной, не равна вероятности того, что деталь изготовленная на втором заводе, окажется бракованной; заводы изготавливают детали разного качества). Так как по условию задачи не требуется проверить, на каком заводе качество изготавливаемых деталей выше, выдвигаем двустороннюю конкурирующую гипотезу.

Так как конкурирующая гипотеза - двусторонняя, то и критическая область - двусторонняя.

В качестве критерия для сравнения двух вероятностей биномиальных распределений используется случайная величина U:

Его наблюдаемое значение uнабл. рассчитывается по формуле:

, (8.9)

где m1 / n1 - относительная частота (частость) появления события в первой выборке;

m2 / n2 - относительная частота (частость) появления события во второй выборке;

- средняя частость появления события;

- средняя частость непоявления события;

;

n1 - объем первой выборки;

n2 - объем второй выборки.

По условию: m1 = 20; n1 = 200; m2 = 15; n2 = 300; a = 0,025.

Найдем - среднюю частость появления события:

.

Найдем - среднюю частость непоявления события:

= 1 - 0,07 = 0,93.

Найдем uнабл.:

Так как конкурирующая гипотеза - двусторонняя, критическое значение (uкр.) следует находить по таблице функции Лапласа (приложение 2) из равенства:

Ф0(uкр ) = (1 - a) / 2.

По условию a = 0,025.

Отсюда:

Ф0(uкр ) = (1 - 0,025) / 2 = 0,4875.

По таблице функции Лапласа (приложение 2) найдем при каком uкр. Ф0(uкр ) = 0,4875.

F0(2,24) = 0,4875.

Учитывая, что конкурирующая гипотеза - двусторонняя, находим две критические точки:

uкр.(прав.) = 2,24; uкр.(лев.) = - 2,24.

Заметим, что при правосторонней конкурирующей гипотезе Н1: р1 > р2 uкр. следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(uкр ) = (1 - 2a) / 2.

При левосторонней конкурирующей гипотезе Н1: р1 < р2 uкр. следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(uкр ) = (1 - 2a) / 2 и присваивать ему знак "минус").

-uкр. < uнабл. < uкр, следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу. По имеющимся данным на уровне значимости a = 0,025 нет оснований отклонить нулевую гипотезу. Следовательно, заводы изготавливают детали одинакового качества.

 
 

 


Критическая Область допустимых Критическая

область значений область

 

U

 

-uкр. = -2,24 uнабл.= 2,15 uкр.= 2,24

Рис.8.9.

Наблюдаемое значение критерия попадает в область допустимых значений, следовательно, нет оснований отклонить нулевую гипотезу.

Ответ. Нет оснований отклонить нулевую гипотезу, то есть имеющееся различие в качестве изготавливаемых этими заводами деталей - случайно, незначимо.

 

Задачи к теме 8

 

1. Компания, производящая средства для потери веса, утверждает, что прием таблеток в сочетании со специальной диетой позволяет сбросить в среднем в неделю 800 граммов веса. Случайным образом отобраны 25 человек, использующих эту терапию, и обнаружено, что в среднем еженедельная потеря в весе составила 830 граммов со средним квадратическим отклонением 250 граммов. Ответьте, правда ли, что потеря в весе составляет 800 граммов? Уровень значимости a = 0,05.

 

2. Компания утверждает, что новый вид зубной пасты для детей лучше предохраняет зубы от кариеса, чем зубные пасты, производимые другими фирмами. Для проверки эффекта в случайном порядке была отобрана группа из 500 детей, которые пользовались новым видом зубной пасты. Другая группа из 600 детей, также случайно выбранных, в это же время пользовалась другими видами зубной пасты. После окончания эксперимента было выяснено, что у 30 детей, использующих новую пасту, и 35 детей из контрольной группы появились новые признаки кариеса. Имеются ли у компании достаточные основания для утверждения о том, что новый сорт зубной пасты эффективнее предотвращает кариес, чем другие виды зубной пасты? Принять уровень значимости a = 0,05.

3. По оценкам оператора сотовой связи средняя длительность ежедневных звонков составляет 24 минуты на одного абонента. Выборочное обследование 100 абонентов показало, что среднедневная длительность звонков составляет 30 минут. На уровне значимости a = 0,05 оцените статистическую значимость различий выборочного обследования, если известно, что стандартное отклонение длительности звонков в генеральной совокупности составляет 3 минуты.

 

4. По оценкам финансовых аналитиков риск потери денежных средств для инвесторов арт - бизнеса составляет 17% в течение пяти лет. Среди 400 постоянных клиентов аукционного дома был проведен опрос, в ходе которого выяснилось, что 65 из них потеряли средства на вложениях в предметы искусства за последние пять лет. Можно ли утверждать, что оценки финансовых аналитиков совпадают с действительностью на уровне значимости a = 0,01?

 

5. Крупный коммерческий банк заказал маркетинговое исследование по выявлению эффекта «премирования» (калькулятор, набор ручек и др.), как стимула для открытия счета в банке. Для проверки случайным образом было отобрано 230 «премированных» посетителей и 200 «не премированных». В результате выяснилось, что 80% посетителей, которым предлагалась премия и 75% посетителей, которым не предлагалась премия, открыли счет в банке в течение 6 месяцев. Используя эти данные, проверьте гипотезу о том, что доля «премированных» посетителей, открывших счет в банке, статистически существенно отличается от удельного веса «не премированных» посетителей, открывших счет в банке. Принять уровень значимости a = 0,01.

6. По данным российской аналитической компании средняя розничная цена покупки мобильного телефона в 2006 году составила 5000 рублей. Выборочная оценка 25 случайно выбранных телефонов, купленных в одном из салонов города показала, что средняя цена купленного телефона составляет 5200 рублей с исправленным средним квадратическим отклонением 250 рублей. На уровне значимости a = 0,01 проверьте гипотезу о том, что средняя розничная цена мобильного телефона, купленного в 2006 году равна 5200 рублей.

 

7. Компания, выпускающая в продажу новый сорт сока, проводит оценку вкусов покупателей по случайной выборке из 500 человек, и оказалось, что 310 из них предпочли новый сорт всем остальным. Проверьте на уровне значимости a = 0,01 гипотезу о том, что новый сорт сока предпочитают 65 % потребителей.

8. Страховая компания изучает вероятность дорожных происшествий для подростков, имеющих мотоциклы. За прошедший год проведена случайная выборка 1000 страховых полисов подростков-мотоциклистов и выявлено, что 11 из них попадали в дорожные происшествия и предъявили компании требование о компенсации за ущерб. Может ли аналитик компании отклонить гипотезу, о том, что менее одного процента всех подростков-мотоциклистов, имеющих страховые полисы, попадали в дорожные происшествия в прошлом году? Принять уровень значимости a = 0,05.

9. Новое лекарство, изобретенное для лечения атеросклероза, должно пройти экспериментальную проверку для выяснения возможных побочных эффектов. В ходе эксперимента лекарство принимали 7000 мужчин и 6000 женщин. Результаты выявили, что 100 мужчин и 100 женщин испытывали побочные эффекты при приеме нового медикамента. Можем ли мы на основании эксперимента утверждать, что побочные эффекты нового лекарства у женщин проявляются в большей степени, чем у мужчин? Принять уровень значимости a = 0,01.

10. Руководство фирмы - провайдера полагает, что проведение рекламной акции приведет к увеличению числа новых клиентов. За 30 рабочих дней после проведения рекламной акции число новых клиентов составило 120 чел., тогда как до нее в среднем за день к услугам Internet впервые подключились 2 чел. Считая среднее квадратическое отклонение равным 3, на уровне значимости 0,01 определите принесла ли успех рекламная акция?