Порядок выполнения задания

ЗАДАНИЯ ДЛЯ ПРАКТИЧЕСКИХ ЗАНЯТИЙ

Робинзон Крузо уже несколько лет живет на необитаемом острове. Пытаясь выжить и

наметив для этого огромное количество работы, он понимает, что ему необходимо каким-то

образом упорядочить свою жизнь. Для этого он решает оптимизировать свою повседневную

деятельность, а наше дело – помочь ему! Используя при этом методы эконометрики…

Ситуация 1: «Робинзон на охоте». Каждый раз, отправляясь охотиться на уток,

Робинзон берет с собой флягу пива собственного приготовления, так как в условиях

субтропиков ему постоянно хочется пить. При этом он отмечает среднюю температуру в день

охоты (в градусах Цельсия, X3), количество убитых уток (в штуках, X2) и сколько при этом было

выпито пива (в процентах от объема фляги, X1).

ЗАДАНИЕ 1.

ПЕРВИЧНЫЙ ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ.

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Цель: закрепить знания по теории вероятностей и математической статистике, касающиеся

первичной обработки экспериментальных данных; ознакомиться с основными положениями,

понятиями и методами проведения корреляционного анализа данных.

 

Вариант 43 X1 X2 X3

 

Порядок выполнения задания

1. По имеющимся результатам наблюдений для каждого показателя определить

основные статистические характеристики (среднее, медиану, дисперсию,

среднеквадратическое отклонение, коэффициенты асимметрии и эксцесса,

коэффициент вариации, используя стандартные функции Excel – СРЗНАЧ(),

МЕДИАНА(), ДИСП(), СТАНДОТКЛОН(), СКОС() и ЭКСЦЕСС()

соответственно), сделать предварительные выводы о свойствах выборки.

2. Провести разбиение выборок на классы однородности, построить

кумулятивные линии эмпирического распределения и гистограммы.

Проанализировать полученные графики.

3. Сформулировать и проверить гипотезу согласии выборочных данных с

нормальным распределением на основе критерия χ2-Пирсона. Сделать выводы.

4. Нанести исходные данные на координатную плоскость и сделать обоснованное

предварительное заключение о наличии (отсутствии) связи между всеми

парами факторов, а также о ее характере (положительная или отрицательная) и

форме (линейная или нелинейная).

5. Рассчитать парные коэффициенты корреляции для каждой пары показателей.

Построить корреляционную матрицу. Используя t-критерий Стьюдента,

проверить значимость полученных коэффициентов корреляции. Сделать

выводы о тесноте связи между факторами.

6. Для каждой пары показателей вычислить частный коэффициент корреляции и

проверить его на значимость. Для значимых коэффициентов построить 95%

доверительные интервалы. Сделать выводы.

7. Вычислить все возможные множественные коэффициенты корреляции.

Сделать выводы.

8. По результатам работы сделать общие выводы и сформулировать

рекомендации для Робинзона.

 

Используя стандартные функции Exel мы рассчитали основные статистические характеристики:

1. Среднее значение

  X1 X2 X3
Среднее значение 59,04 9,12 31,86

 

Вывод: Среднее значение для X1 говорит о том что Робинзон выпивает 59,04 % пива от всего объёма фляги, среднее значение X2 говорит о том что Робинзон Крузо убивает 9 уток и средняя температура в день охоты составляет 33 градуса Цельсия.

2.Медиана

  X1 X2 X3
Медиана 61,5

В половине случаев Робинзон Крузо выпивает более 61% от объема фляги, а в других менее. А уток в половине случаев убивает более 9, а в другой половине менее 9. Так же в одной половине случаев температура превышает 31, а в другой половине не превышает 31 градус.

 

3.Дисперсия

  X1 X2 X3
Дисп 599,8351 20,51592 25,55143

 

Вывод: Наибольшая дисперсия у первого признака, показатели не интерпретируются, так измеряются в разных единицах.

4.Среднеквадратическое (стандартное) отклонение

  X1 X2 X3
СТАНДОТКЛОН 24,49153 4,52945 5,054842

 

Вывод: Робинзон выпивает в интервале от 34.55 % до 83.53 %. Убивает уток в интервале от 4 до 13. Средняя температура в интервале от 26 до 36 градусов.

5. Коэффициент асимметрии

  X1 X2 X3
СКОС -0,15946 0,205437 0,07357

 

Вывод: Робинзон выпивает пива больше на 15 процентов чем среднее значение, убивает уток меньше на 20 процентов, а температура воздуха в день охоты меньше на 7 процентов, чем среднее значение.

 

6. Коэффициент эксцесса

  X1 X2 X3
ЭКСЦЕСС -1,14947 -0,33219 -0,92744

 

Вывод: Робинзон Крузо не может спрогнозировать, сколько он выпьет пива, сколько убьет уток и среднюю температуру, потому что коэффициенты эксцесса отрицательные.

 

7. Коэффициент вариации

 

  X1 X2 X3
СТАНДОТКЛОН 41,48295 49,66502 15,86579

 

Вывод: коэффициент вариации показывает средний разброс выпитого пива от общего объема, средний разброс от убитых уток, и средний разброс температуры воздуха.

Совокупность считается однородной, если коэффициент вариации не превышает 33 %.

 

Задача 2

Для того что бы, провести разбиение выборок на классы однородности воспользуемся формулой Стрёрджеса:

К= [1+3.32 lgN] = [1+3.32 lg50]=6 (т.е выборку необходимо разбить на 6 классов)

Далее рассчитываем ширину интервалов (b):

, где — размах вариации

Пиво(Х1):

=100-12=88 => b= 14,67

Утки(Х2):

=21-0=21 =>b= 3,5

Температура(Х3):

=40-23=17 => b= 2,833

Х1 Х2 Х3
14,67 3,5 2,833

 

Данные для построения графиков:

Объем выпитого пива

№ класса Границы интервала[ ) Среднее значение Наблюдаемая частота Кумулятивная частота
[12 ;26,67) 19,3
[26,67; 41,33) 34,0
[41,33; 56,00) 48,7
[56,00; 66,67) 63,3
[66,67; 83,33) 78,0
[83,33; 100,00] 92,7
- - -

 

Количество убитых уток

№ класса Границы интервала[ ) Среднее значение Наблюдаемая частота Кумулятивная частота
[0; 3) 1,33
[3; 5) 4,0
[5; 8) 6,67
[8; 11) 9,33
[11; 13) 12,0
[13; 16) 14,67
-   -

 

Температура

№ класса Границы интервала[ ) Среднее значение Наблюдаемая частота Кумулятивная частота
[20 ; 23,3) 21,7
[23,3; 26,7) 25,0
[26,7; 30) 28,3
[30; 33,3) 31,7
[33,3; 36,7) 35,0
[36,7; 40) 38,3
-   -

 

Кумулятивные линии эмпирического распределения:

Кумулятивные линии эмпирического распределения показывают, сколько значений попадет в определенный интервал по накопленным частотам.

 

 

Гистограммы:

По ним можно судить о нормальности распределения.

Объем выпитого пива:

Вывод: наибольшее количество пива Робинзон Крузо выпивает в интервале от 67 до 83% от объема фляги.


 

Количество убитых уток:

Вывод: наибольшее количество уток Робинзон Крузо убивает в интервале от 5 до 8 уток.

 

Температура:

 

Вывод: наиболее часто встречающаяся температура на острове находится в интервале от 27 до 30 градусов по Цельсию.


 

Задача 3

Сформулируем и проверим гипотезу о согласии выборочных данных с

нормальным распределением на основе критерия χ2-Пирсона. Сделаем выводы.

Значение статистики Пирсона вычисляется по формуле:

где Bi– наблюдаемая абсолютная частота (число выборочных значений,попавших в i -й интервал), Ei – ожидаемая частота, вычисляемая впредположении о нормальном распределении значений фактора x. Ожидаемая частота попадания в i -й интервал вычисляется как

где – значение функции нормального распределения, вычисленное в точке z. Для этого используется стандартная функция Excel

Сформулируем гипотезу:

H0:F(x) = F0(x)

H1:F(x) ≠F0(x)

Основная гипотеза состоит в предположении о согласии выборочных данных с нормальным распределением. Если эта гипотеза не отвергается, то мы можем считать, что возможно распределение является нормальным. Если отвергается, то распределение не является нормальным.

Уровень значимости а=0,05;

Число степеней свободы v = K – 3= 6 – 3 = 3;

Если χрасч > χкрит(0,05; 1; 48), то гипотеза Н0 отвергается.

Если χрасч < χкрит(0,05; 1; 48), то гипотеза Н0 не отвергается.

Построим вспомогательные таблицы для вычисления :

Объем выпитого пива:

№ класса Границы интервала[ ) Наблюдаемая частота, Теоретическая частота,
[12 ;26,67) 3,29 2,24
[26,67; 41,33) 7,09 0,52
[41,33; 56,00) 10,79 0,30
[56,00; 66,67) 11,59 4,97
[66,67; 83,33) 8,80 5,89
[83,33; 100,00] 4,71 0,35
- 46,27 14,27

 

Вывод: рассчитанное значение > , гипотеза согласия выборочных данных с нормальным распределением отвергается.

Количество убитых уток:

№ класса Границы интервала[ ) Наблюдаемая частота, Теоретическая частота,
[0; 3) 4,27 0,02
[3; 5) 10,63 0,18
[5; 8) 14,99 0,00
[8; 11) 11,98 0,08
[11; 13) 5,43 0,46
[13; 16) 1,39 0,11
- 48,68 0,84

 

Вывод: рассчитанное значение < , гипотеза согласия выборочных данных с нормальным распределением не отвергается.

 

Температура:

№ класса Границы интервала[ ) Наблюдаемая частота, Теоретическая частота,
[20 ; 23,3) 3,84 2,61
[23,3; 26,7) 7,36 0,76
[26,7; 30) 10,39 3,03
[30; 33,3) 10,80 3,12
[33,3; 36,7) 8,27 0,01
[36,7; 40) 4,66 4,04
- 45,33 13,55

 

Вывод: рассчитанное значение > , гипотеза согласия выборочных данных с нормальным распределением отвергается.

 


 

Задача 4

Нанесем исходные данные на координатную плоскость и сделаем обоснованное предварительное заключение о наличии (отсутствии) связи между всеми парами факторов, а также о ее характере (положительная или отрицательная) и форме (линейная или нелинейная).

Утки и пиво:

 

Вывод: Есть линейная зависимость, т.к. поле вытянуто вдоль одного направления. Зависимость отрицательная, т.к. с увеличением выпитого пива уменьшается количество убитых уток.


 

Температура и утки:

 

Вывод: Есть линейная зависимость, т.к. поле вытянуто вдоль одного направления. Зависимость отрицательная, т.к. с увеличением температуры уменьшается количество убитых уток.

Температура и пиво:

 

Вывод: Есть линейная зависимость, т.к. поле вытянуто вдоль одного направления. Зависимость положительная, т.к. с увеличением температуры увеличивается количество выпитого пива.

 



о направления. Зависимость положительная, т.к. с увеличением температуры увеличивается количество выпитого пива.