Исходные данные за 2010 год

Федеральное бюджетное государственное образовательное учреждение

Высшего профессионального образования

«Государственный университет управления»

Домашняя работа по дисциплине

«Статистика»

 

 

Выполнил студент

дневной формы обучения

специальности мировая

экономика

II курса группы II ____________ А.Э.Моров

(подпись) (инициалы и фамилия)

Руководитель работы

 

_________ _________ Н.К. Агеева

(ученая степень, звание) (подпись) (инициалы и фамилия)

 

Москва – 2012

СОДЕРЖАНИЕ

Задание 1…………………………………………………………………………3

Задание 2…………………………………………………………………………7

Задание 3…………………………………………………………………………9

Задание 4………………………………………………………………………..14

Задание 5………………………………………………………………………..15

Задание 6………………………………………………………………………..17

Задание 1. Пользуясь базой данных официального сайта www.gks.ru и опубликованных статистических сборников (ежегодников), сформировать массив значений результативного признака (y) по всем субъектам РФ за последний год (годы), оценить однородность совокупности с помощью коэффициента вариации ( ); если окажется > 33% или > 40%, исключить резко выделяющиеся значения из массива с помощью правила «трех сигм» ( , снова проверить на однородность, если совокупность окажется неоднородной, исключить из массива значения до . После этого изготовить статистический формуляр в форме списка.

Таблица 1

Исходные данные за 2010 год.

№п/п субъекта федерации и его название Заболеваемость на 1000 человек населения(травмы, отравления и некоторые другие последствия воздействия внешних причин), (y)
1. Белгородская область 88,3
2. Брянская область 91,8
3. Владимирская область 99,9
4. Воронежская область 57,1
5. Ивановская область 88,3
6. Калужская область 68,7
7. Костромская область 94,1
8. Курская область 67,1
9. Липецкая область 90,2
10. Московская область 74,9
11. Орловская область 94,8
12. Рязанская область 87,8
13. Смоленская область 72,2
14. Тамбовская область 53,7
15. Тверская область 92,4
16. Тульская область 73,9
17. Ярославская область 108,6
18. г. Москва 91,9
19. Республика Карелия 116,8
20. Республика Коми 105,1
21. Архангельская область 113,5
22. Вологодская область 95,1
23. Калининградская область 57,3
24. Ленинградская область 50,7
25. Мурманская область 113,8
26. Новгородская область 93,0
27. Псковская область 87,8
28. г. Санкт-Петербург 115,4
29. Республика Адыгея 79,9
30. Республика Калмыкия 43,0
31. Краснодарский край 75,4
32. Астраханская область 82,9
33. Волгоградская область 80,4
34. Ростовская область 83,2
35. Республика Дагестан 78,0
36. Республика Ингушетия 87,8
37. Кабардино-Балкарская Республика 63,5
38. Карачаево-Черкесская Республика 34,7
39. Республика Северная Осетия - Алания 71,6
40. Чеченская Республика 57,2
41. Ставропольский край 64,0
42.Республика Башкортостан 122,2
43. Республика Марий Эл 111,7
44. Республика Мордовия 78,8
45. Республика Татарстан 101,1
46. Удмуртская Республика 117,2
47. Чувашская Республика 93,1
48. Пермский край 123,7
49. Кировская область 99,6
50. Нижегородская область 94,0
51. Оренбургская область 100,7
52. Пензенская область 78,6
53. Самарская область 110,5
54. Саратовская область 67,6
55. Ульяновская область 98,0
56. Курганская область 106,0
57. Свердловская область 95,1
58. Тюменская область 87,0
59. Челябинская область 107,5
60. Республика Алтай 63,0
61. Республика Бурятия 79,5
62. Республика Тыва 96,0
63. Республика Хакасия 107,1
64. Алтайский край 81,4
65. Забайкальский край 73,7
66. Красноярский край 110,9
67. Иркутская область 117,4
68. Кемеровская область 124,0
69. Новосибирская область 98,3
70. Омская область 89,4
71. Томская область 60,6
72. Республика Саха (Якутия) 104,0
73. Камчатский край 92,3
74. Приморский край 134,0
75. Хабаровский край 103,5
76. Амурская область 85,8
77. Магаданская область 107,4
78. Сахалинская область 71,7
79. Еврейская автономная область 99,1
80. Чукотский автономный округ 123,5


Проверим первичные данные на однородность. Для этого используем коэффициент вариации. Коэффициент вариации – один из наиболее часто используемых показателей. Его применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

где xi – индивидуальное значение признака каждой единицы совокупности, n – число единиц совокупности

= 89,51

= 20,4

=

Вывод: коэффициент вариации < 33%, значит, совокупность однородна.

 

 

Задание 2.Произведем группировку субъектов РФ по признаку «Y» - Заболеваемость на 1000 человек населения (травмы, отравления и некоторые другие последствия воздействия внешних причин), образовав интервальный ряд. Воспользуемся формулой Стерджесса:

, где n – число наблюдений.

= 14,2

Таким образом, интервалы группировки по среднему размеру назначенных пенсий равны:

1 группа от 34,7 до 48,9 (2 субъекта);

2 группа от 48,9 до 63,1 (7 субъектов);

3 группа от 63,1 до 77,3 (12 субъектов);

4 группа от 77,3 до 91,5 (18 субъектов);

5 группа от 91,5 до 105,7 (22 субъекта);

6 группа от 105,7 до 119,9 (14 субъектов);

7 группа от 119,9 до 134,0 (5 субъектов).

Так как, формируя группы, нужно помнить, что распределение единиц совокупности внутри группы должно быть как можно более равномерным (в каждую группу должно входить не менее 3-х значений), то фактическая величина интервала и число групп могут несколько отличаться от расчетных значений.

16,55

 

Сформируем таблицу:

Группировка субъектов РФ по заболеваемости на 1000 человек населения (травмы, отравления и некоторые другие последствия воздействия внешних причин)

 

 

Таблица 2

 

Группы субъектов по заболеваемости на 1000 человек Число субъектов РФ Заболеваемость на 1000 человек
34,7-51,25 128,4
51,25-67,8 611,1
67,8-84,35 1304,8
84,35-100,9 2511,6
100,9-117,45 1977,5
117,45-134 627,4

 

 

Задание 3.Для вычисления показателей центра распределения и показателей вариации построим вспомогательную таблицу 3.

Таблица 3

Группы субъектов по заболеваемости на 1000 человек Центр интервала, (руб.), х' f х' * f х'- f*| х'- | (х'- )2 Накопленная частота, F (х'- )2*f
34,7-51,25 42,98 128,94
-46,53

 

139,59
2165,04

 

6495,12
51,25-67,8 59,53 595,3
-29,98

 

299,8
898,8

 

67,8-84,35 76,08 1293,36
-13,43

 

228,31
180,37

 

3066,29
84,35-100,9 92,63 2501,01
3,12

 

84,24
9,73

 

262,71
100,9-117,45 109,18 1965,24
19,67
 

 

354,06
386,91
 

 

6964,38
117,45-134 125,73 628,65 36,22 181,1 1311,89 6559,45
Итого:   - 7112,5 - 1287,1 -   32332,95

 

а) Рассчитаем показатели центра распределения:

- Среднее арифметическое для полученного интервального ряда:

Xi – середина соответствующего интервала значения признака; вычисляется как средняя из значений границ интервала.

= =

Вывод: заболеваемость на 1000 человек населения по травмам , отравлениям и некоторым другим последствиям воздействия внешних причин составляет .

- Медиана (Ме) соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером. , где n число единиц совокупности.

40,5

,

Me= 84,35+16,55 = 90,79

Вывод: половина субъектов имеет заболеваемость на 1000 человек по травмам, отравлениям и некоторым другим последствиям воздействия внешних причин больше 90,79 человека, другая половина- меньше

- Мода (Мо)- наиболее часто встречающееся значение признака. Мода соответствует интервалу с максимальной частотой, т.е. это будет 1 интервал.

Mo= 84,35+ 16,55 93,06

Вывод: наиболее часто встречающиеся значения заболеваемости на 1000 человек по травмам, отравлениям и некоторым другим последствиям воздействия внешних причин составляет 93,06 человека.

 

Б) Рассчитаем показатели степени вариации:

-Размах вариации:

R=

R= 134-34,7=99,3

-Среднее линейное отклонение:

= = =16,1

Вывод: Средняя заболеваемость на 1000 человек по травмам, отравлениям и некоторым другим последствиям воздействия внешних причин отличается среднего в среднем на 16,1 человека

-Среднее квадратическое отклонение ( ):

= = 20

-Дисперсия

= 404,16

-Коэффициент вариации:

Совокупность однородна, т.к. коэффициент вариации меньше 33%

в) Рассчитаем показатели формы распределения:

Показатель ассиметрии можно рассчитать по двум формулам:

и

Симметричным будет считаться распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения равны между собой. Для симметричных распределений имеет место равенство средней арифметической, моды и медианы. В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разность между средними , тем больше асимметрия ряда.

= = -0,21

,следовательно асимметрия левосторонняя. При левосторонней асимметрии между показателями центра распределения существует отношение , и действительно для данного распределения это соотношение выполняется, т.е: 93,06 >90,79

Наиболее точным является показатель асимметрии, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):

Для расчета центрального момента третьего порядка сформируем вспомогательную таблицу 4.

Таблица 4

 

Группы субъектов по заболеваемости на 1000 человек Центр интервала, (руб.), х' f х'- (х'- )3 (х'- )3*f
34,7-51,25 42,98
-46,53

 

-100739,35 302218,05
51,25-67,8 59,53
-29,98

 

26946,4
67,8-84,35 76,08
-13,43

 

2422,31 41179,27
84,35-100,9 92,63
3,12

 

30,37
100,9-117,45 109,18
19,67
 

 

7610,5
117,45-134 125,73 36,22 47516,6
Итого:   - -   988253,3  

 

= = 12353,17

As= = 1,52

Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений и рассчитывается по формуле:

= 0,07

= 1,52/0,07 = 21,71> 3, следовательно, ассиметрия существенна и распределение признака в генеральной совокупности не является симметричным.

Показатель эксцесса:

Распределение стран по расходам на здравоохранение на душу населения характеризуется значительной асимметрией, поэтому показатель эксцесса не рассчитывается.

 

Задание 4

Таблица 5

Название округа Число субъектов в округе Среднегодовая численность населения, тыс.чел. % населения
Центральный федеральный округ   37 136,3 26,2
Северо-Западный федеральный округ   13 481,7   9,4
Южный федеральный округ   22 868,4   16,1
Приволжский федеральный округ   30 199,7   21,3
Уральский федеральный округ   12 247,7   8,6
Сибирский федеральный округ   19 549,4   13,8
Дальневосточный федеральный округ   6 473,2   4,6
Итого: 141 956,40
         

 

Вывод: В центральном федеральном округе численность населения наибольшая.

 

Задание 5

Проверить правило сложений дисперсии по результативному признаку.

Таблица 6

Группы субъектов 6473,2 – 14542,2 14542,2 – 22611,2 22611,2 – 30680,2 30680,2 – 38749,2
Количество регионов  
Ожидаемая продолжительность жизни, лет 6 473,2 12 247,7 13 481,7   19 549,4   22 868,4 30 199,7   37 136,3

Таблица 7

Показатель среднегодовой численность населения, тыс.чел ( ) -
6 473,2 12 247,7 13 481,7   -13805,8 -8031,3 -6797,3
190600113,6
64501779,7
46203287,3
 
 

 

  10734,2   -4261 1 513,50 2 747,50   18 156 121,00 2 290 682,3 7 548 756,3  
19 549,4   -729,6 532316,2 19549,4
22 868,4 30 199,7   2589,4 9920,7
6704992,4 98420288,5
 

 

  -14267,9 -6936,6 203 572 970,4 48 116 419,6  
37 136,3 16857,3   284168563,3 37136,3
Итого:141956,4 - - - 279684590,1
  Согласно правилу сложения дисперсий общая дисперсия ( ) равна сумме средней из внутригрупповых ( ) и межгрупповой ( ) дисперсий. Общая дисперсия характеризует вариацию результативного признака под влиянием всех факторов, формирующих уровень признака у единиц совокупности данных. Она определяется по формуле:   1) где - общая средняя арифметическая для всей изучаемой совокупности.   = чел.   2) Межгрупповая дисперсияотражает систематическую вариацию, т.е. различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки:   ni- число единиц в определенной группе; - средняя по отдельной группе; - общая средняя по совокупности единиц.   3) Средняя внутригрупповая дисперсияхарактеризует случайную вариацию результативного признака, возникающих под влиянием других, неучтенных факторов и не зависит от признака-фактора, положенного в основу группировки. Она определяется по формуле:         98733048,7 = 90894364,4 +7838684,3 (верно!)   Задание 6   Коэффициент детерминации:   = 92 %   Вывод: разница в уровне ожидаемой продолжительности жизни на 7,92 % обусловлена влиянием уровня расходов на здравоохранение на душу населения, а на 92,08% - влиянием других факторов