д) Перевірка гіпотези про рівність генеральних середніх. Критерій Уілкоксона

Критерій Уілкоксона використовується для перевірки гіпотези про рівність генеральних середніх за статистичними даними двох вибірок тоді, коли дані не підкоряються нормальному закону розподілу.

Формулюються гіпотези:

Н0 – середні двох генеральних сукупностей рівні, тобто ;

Н1 - середні двох генеральних сукупностей не рівні, тобто .

Для здійснення перевірки необхідно, щоб об’єм першої вибірки п1 був менше об’єму другої вибірки п2. Якщо ця умова не виконується, то слід змінити місця вибірок, тобто першу вважати другої. Перевірка виконується за такими етапами:

1) Формується об’єднана вибірка, об’єм якої п=п1+п2.

2) Даним об’єднаної вибірки присвоюються ранги (порядкові номери) за правилом: найменшому значенню присвоюється ранг 1, наступному найменшому – ранг 2 і т. д. При цьому, якщо деякі елементи вибірки співпадають, то їм присвоюються середні ранги. Для цього додаються ранги, які мали б ці елементи, якщо були б різні; розраховується їх середнє арифметичне; кожному із однакових елементів присвоюється ранг, що дорівнює розрахованому середньому арифметичному.

3) Розраховуються суми рангів елементів вихідних вибірок .

4) Обирається величина W: якщо вибірки рівні за об’ємом, то W= або W= ; якщо вибірки різні за об’ємом, то W= – сумі рангів меншої за об’ємом вибірки.

5) Розраховується значення W* критерію Уілкоксона за формулою:

. (10)

6) Якщо у вибірці є дані з однаковими рангами – зв’язки, то критерій Уілкоксона W*розраховується за формулою:

, (11)

де т – кількість груп однакових рангів, що містять дані обох вибірок (кількість загальних зв’язок);

– кількість елементів в і-тої групі (розмір зв’язок).

6) Обирається рівень значущості .

7) Розраховується найменший рівень значущості ргр за формулою:

, (12)

де Ф(и) – функція нормального стандартного розподілу, значення якої можна знайти в статистичних таблицях або за допомогою вбудованої функції Excel НОРМРАСП: ргр=НОРМРАСП(W*; 0; 1; ИСТИНА).

8) Порівнюються рівень значущості і величина ргр. Якщо ргр> , то гіпотеза Н0 про рівність генеральних дисперсій приймається.


 

ХІД РОБОТИ

Перевірка статистичних гіпотез зазвичай здійснюється за такими етапами:

· Висунення припущень про вид розподілу досліджуваної величини (величин) або про її числові характеристики.

· Формулювання статистичних гіпотез.

· Вибір критерію перевірки відповідно до змісту гіпотез і статистичних даних.

· Вибір рівня значущості залежно від вимог до точності результатів дослідження.

· Розрахунок значення оберненого критерію за статистичними даними.

· Порівняння розрахованого значення критерію з його критичним значенням і прийняття або відкидання основної гіпотези

Завдання для самостійної роботи

2.1. При дослідженні ефективності ліків двох типів було сформовано дві групи хворих з 15 осіб. У випадку використання ліків першого типу строк одужання склав, у середньому, 11 днів з дисперсією 3 дні; другого – 8 днів з дисперсією 4 дні. Перевірити на рівні значущості 0,01 гіпотезу про перевагу другого типу ліків.

2.2. При дослідженні якості продукції, яку випускають дві фірми, було перевірено 50 одиниць продукції першої фірми і 63 одиниці другої. Середня оцінка продукції першої фірми склала 36 балів, другої – 32 бали. Дисперсія оцінок виявилася рівною 10. Визначити фірму, що виробляє більш якісну продукцію на рівні значущості 0,01ю

2.3. Середній річний об’єм виробництва 10 однотипних компаній в регіоні А склав 5900 одиниць продукції; 8 компаній того ж типу в регіоні В – 5690 одиниць. Вибіркова дисперсія об’єму виробництва в регіоні А склала 1000, в регіоні В – 1500. Перевірити гіпотезу про рівність середніх значень на рівні значущості 0,05.

2.4. Середня урожайність пшениці у фермерському хазяйстві складала 75 ц/га. Після внесення нового добриву середня урожайність підвищилася на 5 ц/га. Вибіркова дисперсія склала 2,5 ц/га. Перевірити на рівні значущості 0,01 гіпотезу про доцільність нового добриву.

2.5. Середня продуктивність праці на підприємстві складала 30 одиниць продукції за зміну з дисперсією 4. Після внесення змін в організацію праці середня продуктивність склала 34 з дисперсією 7. Перевірити на рівні значущості 0,01 гіпотезу про доцільність внесення змін в організацію праці.

2.6. Для виробництва кожної з п1=53 деталей за першою технологією було витрачено, у середньому секунд часу з дисперсією . Для виробництва кожної з п2=43 деталей за дру­гою технологією було витрачено, у середньому секунд часу з дисперсією (табл. 1) Чи можна зробити висновок, що для виробництва деталей за першою технологією пот­рібно, у середньому, більше часу, ніж за другою. Гіпотезу перевірити на рівні значущості .

Таблиця 1

2.6 0,05

2.7. Знайти закон розподілу величини Х – кількості відвідувачів ресторану швидкого харчування за даними таблиці 2.17.

Таблиця 2.7

Час роботи 9.00 – 11.00 11.00 – 13.00 13.00 – 15.00 15.00 – 17.00 17.00 – 19.00 19.00 – 21.00
Кількість відвідувачів

 


 

  n1 n2 x1 x2 s1 s2 F-Фішер F-критичне t-Стюарт t-критичне
2.1 1.777778 3.697541 2.3237 3.0469
  Но-вірна                  

Н0-другий тип ліків переважає над першим

  n1 n2 x1 x2 s1 s2 F-Фішер F-критичне t-Стюарт t-критичне
2.2 1.870604 2.09314 3.046929
  Но-вірна                  
  x1-x2   n1s1^2 n2s2^2   1/n1+1/n2 т1+т2-2      
    0.035873 101.8018 1.911004  

Задача полягає у перевірці рівності генеральних дисперсій. Н0- генеральні дисперсії рівні (перша фірма виробляє більш якісну продукцію)

  n1 n2 x1 x2 s1 s2 F-Фішер F-критичне t-Стюарт t-критичне
2.3 2.25 3.676675 0.334664 3.046929
  Но-вірна                  
  x1-x2   n1s1^2 n2s2^2   1/n1+1/n2 т1+т2-2      
    0.225 627.495  

Н0- середні значення рівні

2.4   n=1 x1 x2 s d t-Стюарт t-критичне
    127.3213

Н0- внесення змін доцільно

  n1 n2 x1 x2 s1 s2 F-Фішер F-критичне t-Стюарт t-критичне
2.6 215.7073 2.387919 3.046929
  Но-вірна                  
  x1-x2   n1s1^2 n2s2^2   1/n1+1/n2 т1+т2-2      
    0.042124 2.931423  

Н0- гіпотеза вірна