Обчислення та аналіз узагальнюючих характеристик статистичної сукупності

ЗВІТ

З навчальної практики зі статистики

 

Виконав:

студент ІІ курсу 5 групи

економічного факультету,

напрям підготовки «Фінанси і кредит»,

Гусак Віталій Олександрович

Науковий керівник:

Путятіна Любов Дмитрівна

 

Київ – 2012

Зміст

Вступ……………………………………………………………………………...3

1. Обчислення та аналіз узагальнюючих характеристик статистичної сукупності…………………………………………………………………………5

2. Обчислення та аналіз регресії…………………………………………………..9

3. Оцінка суттєвості регресії та окремих параметрів регресії …………………13

4. Обчислення та аналіз коефіцієнтів кореляції і детермінації…………..……15

Висновок…………………………………………………………………..……17

 

Вступ

Нашим завданням постало проведення статистичного дослідження на тему «Кореляційний аналіз» за допомогою пакету програм «Аналіз даних» в системі MS Excel, де результативною ознакою є урожайність зернових, а факторними – якість грунту і затрати праці на 1 ц зернових.

Мета практики – закріплення теоретичних знань з статистики, набуття практичних навиків самостійного статистичного дослідження з використанням комп’ютерної техніки.

Завдання практики – набуття практичних навиків самостійного статистичного дослідження по таких основних розділах:

- проектування системи статистичних показників для аналізу масових економічних явищ відповідно до теми статистичного дослідження;

- формування масиву вихідних даних (вибірки) для статистичного дослідження;

- вибір методів та складання методики аналізу статистичних даних;

- обчислення узагальнюючих показників з використанням пакету програм MS Excel;

- статистична оцінка суттєвості показників на основі вибіркового методу;

- складання і оформлення статистичних таблиць;

- побудова статистичних графіків з використанням комп’ютерної техніки;

- формулювання висновків за результатами статистичного дослідження.

В кореляційному аналізі враховується ще й те, що окрім досліджуваних факторів обов’язково є й випадкові не досліджувані фактори. Кореляційно-регресійний аналіз здійснюється на основі масових даних звітності підприємств ( в нашому випадку по 25 підприємствам ).

Таблиця 1. Дані про урожайність зернових (У, ц/га) та якість грунту (Х1, балів) і затрат праці на 1 ц зернових (Х2, люд.-год.)

№ господарства Зернові
Урожайність, ц/га Якість грунту, балів Затрати праці на 1 ц зернових , люд.-год.
  У х1 х2
32,00 1,09
18,40 2,00
30,00 1,20
24,20 1,54
31,10 1,50
16,70 2,00
26,20 1,55
20,30 1,62
25,10 1,41
18,80 1,88
25,70 1,47
19,60 1,90
25,70 2,19
19,30 1,80
17,60 2,21
32,80 1,30
24,00 1,62
20,40 1,67
33,10 1,19
20,90 1,96
26,40 1,43
28,50 1,33
31,90 1,00
28,60 1,56
19,00 1,92

 

 

Обчислення та аналіз узагальнюючих характеристик статистичної сукупності.

Обчислення узагальнюючих показників необхідне перш за все для оцінки передумов кореляційного аналізу. Серед них: достатня варіація досліджуваних показників та достатня однорідність вибірки. Узагальнюючі показники за даними «кореляційний аналіз урожайності зернових» обчислюємо за допомогою програми MS Excel «описательная статистика». Наша вибірка охоплює 25 господарств.

Таблиця 2. Результати аналізу за допомогою програми «Описательная статистика»

У   Х1   Х2  
Среднее 24,652 Среднее 69,04 Среднее 1,6136
Стандартная ошибка 1,062106712 Стандартная ошибка 2,869657355 Стандартная ошибка 0,066987262
Медиана 25,1 Медиана Медиана 1,56
Мода 25,7 Мода Мода
Стандартное отклонение 5,310533558 Стандартное отклонение 14,34828677 Стандартное отклонение 0,334936312
Дисперсия выборки 28,20176667 Дисперсия выборки 205,8733333 Дисперсия выборки 0,112182333
Эксцесс -1,345540619 Эксцесс -1,35901344 Эксцесс -0,796418385
Асимметричность 0,150828482 Асимметричность -0,08818879 Асимметричность 0,05249815
Интервал 16,4 Интервал Интервал 1,21
Минимум 16,7 Минимум Минимум
Максимум 33,1 Максимум Максимум 2,21
Сумма 616,3 Сумма Сумма 40,34
Счет Счет Счет
Наибольший(1) 33,1 Наибольший(1) Наибольший(1) 2,21
Наименьший(1) 16,7 Наименьший(1) Наименьший(1)
Уровень надежности(95,0%) 2,192080499 Уровень надежности(95,0%) 5,922681646 Уровень надежности(95,0%) 0,138254914

Мода – це така варіанта яка зустрічається в даній сукупності найбільше число разів.

Моу=25,7;

Мох1=90;

Мох2=2.

Медіанаце варіанта, яка ділить впорядковану сукупність на дві рівні частини.

Меу=25,1;

Мех1=72;

Мех2=1,56.

Ексцес – показник, що вираховують для встановлення величини відхилення від нормального розподілу.

ЕхУ=-1,3455 - плосковепшинний

ЕхХ2=-1,3590- плосковершинний

ЕхХ4=-0,7964- плосковершинний

Асиметричність – відхилення між характеристиками центра розподілу.

AsY=0,1508 – правостор.

AsX1=0,0882 – правостор.

AsX2= 0,0525 – правостор.

Середня величина – характеризує типовий рівень ознаки в сукупності.

У=24,652

Х1=69,04

Х2=1,61

Дисперсія – величина, яка використовується для оцінки варіації, при вимірюванні взаємозв’язків, для перевірки статистичних гіпотез.

2 у=28,20

2 х1=205,87

2х2=0,11

Стандартне відхилення – статистична величина, що характеризує абсолютну міру варіації.

у=5,31

х1=14,35

х2=0,33

Рівень надійності – це встановлений за вибірковими даними рівень, який із заданою ймовірністю охоплює справжнє, але невідоме для нас значення параметра.

Для оцінки однорідності вибірки розглянемо один з методів оцінки мінімального та максимального значень показника з допомогою τ – критерія. Якщо значення τ – критерія менше 3, сумнівне значення показника належить до однорідної вибірки.

В протилежному випадку з вибірки виключається відповідна одиниця сукупності ( з сумнівним значенням показника). Такий методичний підхід до оцінки однорідності статистичної сукупності базується на відомому правилі трьох сігм ( середніх квадратичних відхилень під кривою нормального розподілу). Цей метод є досить ефективним стосовно великих статистичних сукупностей.

Формула критерія: , де Хс – середня арифметична.

В нашому прикладі маємо:

Ø Для урожайності

│16,7– 24,652│/5,31<3;

│33,1-24,652│/5,31<3;

Ø Для якості грунту

│45-69,04│/14,35<3;

│90-69,04│/14,35<3;

Ø Для затрат праці на 1 ц зернових

│1-1,61│/0,33<3;

│2,21-1│/0,33>3.

З таблиці 2 видно, що рівень варіації усіх трьох досліджуваних показників (У, Х1, Х2) достатній. Адже середнє квадратичне відхилення (стандартное отклонение) по відношенню до середньої величини не перевищує 33%:

5,31*100/24,652<33%

14,35*100/69,04<33%

0,33*100/1,61<33 %

Отже, сумнівні варіанти відносяться до однорідної вибірки.

Можна також звернути увагу на незначні розбіжності між модою, медіаною та середньою арифметичною. Це узгоджується і з незначними асиметрією та ексцесом розподілів за досліджуваними показниками, що підтверджує висновок про однорідність вибірки та досліджуваними показниками. Таким чином, передумови для кореляційного аналізу є.