Обчислення та аналіз узагальнюючих характеристик статистичної сукупності
ЗВІТ
З навчальної практики зі статистики
Виконав:
студент ІІ курсу 5 групи
економічного факультету,
напрям підготовки «Фінанси і кредит»,
Гусак Віталій Олександрович
Науковий керівник:
Путятіна Любов Дмитрівна
Київ – 2012
Зміст
Вступ……………………………………………………………………………...3
1. Обчислення та аналіз узагальнюючих характеристик статистичної сукупності…………………………………………………………………………5
2. Обчислення та аналіз регресії…………………………………………………..9
3. Оцінка суттєвості регресії та окремих параметрів регресії …………………13
4. Обчислення та аналіз коефіцієнтів кореляції і детермінації…………..……15
Висновок…………………………………………………………………..……17
Вступ
Нашим завданням постало проведення статистичного дослідження на тему «Кореляційний аналіз» за допомогою пакету програм «Аналіз даних» в системі MS Excel, де результативною ознакою є урожайність зернових, а факторними – якість грунту і затрати праці на 1 ц зернових.
Мета практики – закріплення теоретичних знань з статистики, набуття практичних навиків самостійного статистичного дослідження з використанням комп’ютерної техніки.
Завдання практики – набуття практичних навиків самостійного статистичного дослідження по таких основних розділах:
- проектування системи статистичних показників для аналізу масових економічних явищ відповідно до теми статистичного дослідження;
- формування масиву вихідних даних (вибірки) для статистичного дослідження;
- вибір методів та складання методики аналізу статистичних даних;
- обчислення узагальнюючих показників з використанням пакету програм MS Excel;
- статистична оцінка суттєвості показників на основі вибіркового методу;
- складання і оформлення статистичних таблиць;
- побудова статистичних графіків з використанням комп’ютерної техніки;
- формулювання висновків за результатами статистичного дослідження.
В кореляційному аналізі враховується ще й те, що окрім досліджуваних факторів обов’язково є й випадкові не досліджувані фактори. Кореляційно-регресійний аналіз здійснюється на основі масових даних звітності підприємств ( в нашому випадку по 25 підприємствам ).
Таблиця 1. Дані про урожайність зернових (У, ц/га) та якість грунту (Х1, балів) і затрат праці на 1 ц зернових (Х2, люд.-год.)
№ господарства | Зернові | ||
Урожайність, ц/га | Якість грунту, балів | Затрати праці на 1 ц зернових , люд.-год. | |
У | х1 | х2 | |
32,00 | 1,09 | ||
18,40 | 2,00 | ||
30,00 | 1,20 | ||
24,20 | 1,54 | ||
31,10 | 1,50 | ||
16,70 | 2,00 | ||
26,20 | 1,55 | ||
20,30 | 1,62 | ||
25,10 | 1,41 | ||
18,80 | 1,88 | ||
25,70 | 1,47 | ||
19,60 | 1,90 | ||
25,70 | 2,19 | ||
19,30 | 1,80 | ||
17,60 | 2,21 | ||
32,80 | 1,30 | ||
24,00 | 1,62 | ||
20,40 | 1,67 | ||
33,10 | 1,19 | ||
20,90 | 1,96 | ||
26,40 | 1,43 | ||
28,50 | 1,33 | ||
31,90 | 1,00 | ||
28,60 | 1,56 | ||
19,00 | 1,92 |
Обчислення та аналіз узагальнюючих характеристик статистичної сукупності.
Обчислення узагальнюючих показників необхідне перш за все для оцінки передумов кореляційного аналізу. Серед них: достатня варіація досліджуваних показників та достатня однорідність вибірки. Узагальнюючі показники за даними «кореляційний аналіз урожайності зернових» обчислюємо за допомогою програми MS Excel «описательная статистика». Наша вибірка охоплює 25 господарств.
Таблиця 2. Результати аналізу за допомогою програми «Описательная статистика»
У | Х1 | Х2 | |||
Среднее | 24,652 | Среднее | 69,04 | Среднее | 1,6136 |
Стандартная ошибка | 1,062106712 | Стандартная ошибка | 2,869657355 | Стандартная ошибка | 0,066987262 |
Медиана | 25,1 | Медиана | Медиана | 1,56 | |
Мода | 25,7 | Мода | Мода | ||
Стандартное отклонение | 5,310533558 | Стандартное отклонение | 14,34828677 | Стандартное отклонение | 0,334936312 |
Дисперсия выборки | 28,20176667 | Дисперсия выборки | 205,8733333 | Дисперсия выборки | 0,112182333 |
Эксцесс | -1,345540619 | Эксцесс | -1,35901344 | Эксцесс | -0,796418385 |
Асимметричность | 0,150828482 | Асимметричность | -0,08818879 | Асимметричность | 0,05249815 |
Интервал | 16,4 | Интервал | Интервал | 1,21 | |
Минимум | 16,7 | Минимум | Минимум | ||
Максимум | 33,1 | Максимум | Максимум | 2,21 | |
Сумма | 616,3 | Сумма | Сумма | 40,34 | |
Счет | Счет | Счет | |||
Наибольший(1) | 33,1 | Наибольший(1) | Наибольший(1) | 2,21 | |
Наименьший(1) | 16,7 | Наименьший(1) | Наименьший(1) | ||
Уровень надежности(95,0%) | 2,192080499 | Уровень надежности(95,0%) | 5,922681646 | Уровень надежности(95,0%) | 0,138254914 |
Мода – це така варіанта яка зустрічається в даній сукупності найбільше число разів.
Моу=25,7;
Мох1=90;
Мох2=2.
Медіана–це варіанта, яка ділить впорядковану сукупність на дві рівні частини.
Меу=25,1;
Мех1=72;
Мех2=1,56.
Ексцес – показник, що вираховують для встановлення величини відхилення від нормального розподілу.
ЕхУ=-1,3455 - плосковепшинний
ЕхХ2=-1,3590- плосковершинний
ЕхХ4=-0,7964- плосковершинний
Асиметричність – відхилення між характеристиками центра розподілу.
AsY=0,1508 – правостор.
AsX1=0,0882 – правостор.
AsX2= 0,0525 – правостор.
Середня величина – характеризує типовий рівень ознаки в сукупності.
У=24,652
Х1=69,04
Х2=1,61
Дисперсія – величина, яка використовується для оцінки варіації, при вимірюванні взаємозв’язків, для перевірки статистичних гіпотез.
2 у=28,20
2 х1=205,87
2х2=0,11
Стандартне відхилення – статистична величина, що характеризує абсолютну міру варіації.
у=5,31
х1=14,35
х2=0,33
Рівень надійності – це встановлений за вибірковими даними рівень, який із заданою ймовірністю охоплює справжнє, але невідоме для нас значення параметра.
Для оцінки однорідності вибірки розглянемо один з методів оцінки мінімального та максимального значень показника з допомогою τ – критерія. Якщо значення τ – критерія менше 3, сумнівне значення показника належить до однорідної вибірки.
В протилежному випадку з вибірки виключається відповідна одиниця сукупності ( з сумнівним значенням показника). Такий методичний підхід до оцінки однорідності статистичної сукупності базується на відомому правилі трьох сігм ( середніх квадратичних відхилень під кривою нормального розподілу). Цей метод є досить ефективним стосовно великих статистичних сукупностей.
Формула критерія:
, де Хс – середня арифметична.
В нашому прикладі маємо:
Ø Для урожайності
│16,7– 24,652│/5,31<3;
│33,1-24,652│/5,31<3;
Ø Для якості грунту
│45-69,04│/14,35<3;
│90-69,04│/14,35<3;
Ø Для затрат праці на 1 ц зернових
│1-1,61│/0,33<3;
│2,21-1│/0,33>3.
З таблиці 2 видно, що рівень варіації усіх трьох досліджуваних показників (У, Х1, Х2) достатній. Адже середнє квадратичне відхилення (стандартное отклонение) по відношенню до середньої величини не перевищує 33%:
5,31*100/24,652<33%
14,35*100/69,04<33%
0,33*100/1,61<33 %
Отже, сумнівні варіанти відносяться до однорідної вибірки.
Можна також звернути увагу на незначні розбіжності між модою, медіаною та середньою арифметичною. Це узгоджується і з незначними асиметрією та ексцесом розподілів за досліджуваними показниками, що підтверджує висновок про однорідність вибірки та досліджуваними показниками. Таким чином, передумови для кореляційного аналізу є.