Вариационные ряды распределения

Построим вариационный ряд распределения регионов по величине выбросов в атмосферу.

Таблица 2.1

Вариационный ряд распределения регионов РФ по величине по величине выбросов в атмосферу загрязняющих веществ, от стационарных источников

Группы Частота Середина Нак. Частота Часность Нак. часность Xi * Fi Xi – (Xi – )^2 (Xi – )^2 * Fi
0,77 - 654,186 327,478 91,57% 91,57% 24888,328 -123,52 15257,68 1159584,021
654,186 - 1307,602 980,894 3,61% 95,18% 2942,682 529,89 280787,65 842362,9537
1307,602 - 1961,018 1634,31 1,20% 96,39% 1634,31 1183,31 1400222,56 1400222,556
1961,018 - 2614,434 2287,726 2,41% 98,80% 4575,452 1836,73 3373562,40 6747124,798
2614,434 - 3267,85 2941,142 1,20% 100,00% 2941,142 2490,14 6200807,18 6200807,18
Итого - - - 100,00% 36981,91 - - 16350101,51

Где рассчитывается по формуле:

= = = 445,56

Также, изобразим графически в виде гистограммы распределения и полигона, (см. рис. 2.1, 2.2)

 

 

Рис.2.1

Гистограмма распределения регионов РФ по величине выбросов в атмосферу загрязняющих веществ, от стационарных источников

Рис. 2.2

Полигон распределения регионов РФ по величине выбросов в атмосферу загрязняющих веществ, от стационарных источников

 

Построим кумуляту распределения регионов по величине выбросов в атмосферу, отложив по горизонтальной оси значения середины интервалов, а по вертикальной – накопленные частоты (см. рис. 2.3)

 

 

Рис.2.3

Кумулята распределения регионов РФ по величине выбросов в атмосферу загрязняющих веществ, от стационарных источников

 

Также построим огиву, отложив по горизонтальной оси значения накопленной частоты, а по вертикальной – середины интервалов. (см. рис. 2.4)

 

Рис.2.4

Огива распределения регионов РФ по величине выбросов в атмосферу загрязняющих веществ, от стационарных источников

 

Рассчитаем моду и медиану.

Модальным интервалом будет интервал 0,77 - 654,186 тыс.тонн., т.к. частота этого интервала наибольшая. Вычислим моду по формуле:

где xMo – нижняя граница модального интервала; xMo = 0,77

hМо – ширина модального интервала; = 653,416

fMo, fMo-1 и fMo+1 – частоты модального интервала, интервала, предшествующего модальному, и интервала, следующего за модальным.

fMo,=76; fMo-1 = 0 ;fMo+1= 3

В итоге:

Большинство данных регионов имеют величину выбросов около тыс.тонн.

Этот же интервал будет медианным, т.к. половина единиц совокупности (42) достигла значения внутри этого интервала. Вычислим медиану по формуле:

где хМе – нижняя граница медианного интервала,

hМе – ширина медианного интервала, hМе 653,416

SМе-1 – накопленная частота до медианного интервала, = 0

fMе – частота медианного интервала,

Итак, половина регионов имеют величину выбросов меньше тыс.тонн, а половина – больше.

 

Теперь же, найдем дисперсию, среднеквадратичное отклонение и коэффициент вариации по формулам, используя таблицу 2.1:

Коэффициент вариации величины выбросов равен %, что свидетельствует о большом разбросе значений данного признака и о том распределение не равномерно.

 

 

Перейдем ко второму признаку – число умерших от болезней органов дыхания. Построим вариационный ряд распределения.

Таблица 2.2

Вариационный ряд распределения регионов РФ по величине по величине числа умерших от болезней органов дыхания.

Группы Частота Середина Нак. Частота Частность Нак. частность Xi * Fi Xi - (Xi - )^2 (Xi - )^2 * Fi
19 - 830,5 424,75 55,42% 55,42% 19538,5 -540,45 292086,20 13435965,32
830,5 - 1642 1236,25 26,51% 81,93% 27197,5 271,05 73468,10 1616298,255
1642 - 2453,5 2047,75 13,25% 95,18% 22525,25 1082,55 1171914,50 12891059,53
2453,5 - 3265 2859,25 4,82% 100,00% 1894,05 3587425,40 14349701,61
Итого - - 100,00% - 80698,25 - - 42293024,71

 

Где рассчитывается по формуле:

= = = 972,27

 

Дадим графическое представление ряда в виде гистограммы распределения и полигона.(см. рис. 2.5 и 2.6). На основе накопленной частоты построим кумуляту и огиву распределения (см. рис. 2.7 и 2.8).

 

 

Рис. 2.5

Гистограмма распределения регионов РФ по величине числа умерших от болезней органов дыхания

 

Рис. 2.6

Полигон распределения регионов РФ по величине числа умерших от болезней органов дыхания

 

 

Рис. 2.7

Кумулята распределения регионов РФ по величине числа умерших от болезней органов дыхания

 

 

Рис. 2.8

Огива распределения регионов РФ по величине числа умерших от болезней органов дыхания

 

Модальным интервалом будет интервал 19-830,5 чел., т.к. частота этого интервала наибольшая. Вычислим моду по формуле:

где xMo – нижняя граница модального интервала; xMo = 19

hМо – ширина модального интервала; = 811,5

fMo, fMo-1 и fMo+1 – частоты с модального интервала, интервала, предшествующего модальному, и интервала, следующего за модальным.

fMo,=46; fMo-1 = 0 ;fMo+1= 22

В итоге:

Большинство данных регионов имеют величину числа умерших около

Этот же интервал будет медианным, т.к. половина единиц совокупности (42) достигла значения внутри этого интервала. Вычислим медиану по формуле:

где хМе – нижняя граница медианного интервала,

hМе – ширина медианного интервала, hМе 811,5

SМе-1 – накопленная частота до медианного интервала, = 0

fMе – частота медианного интервала,

Итак, половина регионов имеют величину числа умерших меньше чел., а половина – больше.

Найдем дисперсию, среднеквадратичное отклонение и коэффициент вариации, используя таблицу 2.2:

Итак, коэффициент вариации числа умерших равен 73,42%, что свидетельствует о большом разбросе значений и о том распределение не равномерно.

Анализ взаимосвязи

Исследуем возможную взаимосвязь между этими двумя признаками: числом умерших от болезней органов дыхания и выбросами в атмосферу загрязняющих веществ, исходящих от стационарных источников.

Для выявления связи, определения ее направления и тесноты используется корреляционный анализ.

Сначала нужно установить наличие связи. Для этого проведем визуализацию связи, нарисовав поле корреляции (рис. 3.1).

 

Рис. 3.1

Поле корреляции между числом умерших от болезней органов дыхания и выбросами в атмосферу загрязняющих веществ, исходящих от стационарных источников в регионах РФ.

 

На поле корреляции точки, соответствующие отдельным регионам, расположены в общем достаточно хаотично: нет единой линии, вдоль которой выстраивается большинство точек. Можно представить себе линию с сильным положительным наклоном, такую, которая бы включала большинство точек, но остается много точек, которые эта линия не захватывает. Это значит, что признаками можно выделить формальную очень слабую прямую связь, но фактически связь практически отсутствует.

Рассмотрим аналитическую группировку регионов, проведенную в 1 задании (см. табл. 1.4). По ней также видно, что явной связи между данными признаками не выявляется

Степень тесноты и направление связи можно определить с помощью правила сложения дисперсий:

где – общая дисперсия признака-результата, найденная в задании 2;

– средняя из внутригрупповых дисперсий;

– межгрупповая дисперсия, вычисляемая по формуле

, где – среднее значение по группе, – общее среднее, – число единиц в группе.

Найдем межгрупповую дисперсию на основании данных аналитической группировки (см. табл. 1.4) и вычисленного среднего значения из задания 2:

Таблица 3.1

Таблица расчета межгрупповой дисперсии

№ П/П Интервал Число регионов Сумма -
0,77 - 654,19 69361,00 912,64 -52,43 2748,65 208897,27
654,19 -1307,61 4991,00 1663,67 698,59 488041,96 1464125,88
1307,61 -1961,03 2152,00 2152,00 1186,93 1408797,39 1408797,39
1961,03 -2614,45 2228,00 1114,00 148,93 22179,46 44358,93
2614,45 -3267,87 1369,00 1369,00 403,93 163157,60 163157,60
  Итого 80101,00 965,07     3289337,06

 

= = = 39630,56697

=

Найдем коэффициент детерминации

 

и эмпирическое корреляционное отношение

Такое низкое значение эмпирического корреляционного отношения показывает, что связь между данными двумя признаками практически отсутствует.

 

Проведем регрессию между данными двумя признаками на основании линейной зависимости где х – значения признака-фактора (выбросы в атмосферу), у – значения признака-результата (число умерших), – расчетные значения результативного признака. Данные для расчетов приведены в таблице 6.1.

Таблица 3.2

Расчеты для линейной регрессии

Регионы РФ х у x*у х2 у2
Алтайский край 197,24 383428,73 38902,43 853,9922
Амурская область 115,65 67076,42 13374,69 751,6936
Архангельская область 425,91 266193,75 181399,33 1140,712
Астраханская область 103,30 53303,32 10671,10 736,2112
Белгородская область 126,12 63818,24 15907,01 764,8264
Брянская область 32,55 21221,95 1059,44 647,4993
Владимирская область 31,26 24975,94 977,13 645,8819
Волгоградская область 194,86 315095,09 37971,98 851,0168
Вологодская область 411,66 309152,91 169459,84 1122,839
Воронежская область 75,08 137400,06 5637,31 700,829
г.Москва 60,10 196233,03 3612,25 682,0464
г.Санкт-Петербург 50,52 98774,42 2552,67 670,0371
Еврейская автономная область 19,14 2488,72 366,49 630,6916
Забайкальский край 146,30 168681,59 21403,10 790,1227
Ивановская область 38,81 32019,90 1506,37 655,3521
Иркутская область 560,26 1130038,37 313887,91 1309,162
Кабардино-Балкарская Республика 2,91 869,49 8,46 610,3342
Калининградская область 30,36 10716,73 921,67 644,7534
Калужская область 11,77 7282,54 138,42 621,4395
Камчатский край 34,64 4954,09 1200,21 650,1261
Карачаево-Черкесская Республика 19,08 3376,81 363,97 630,6088
Кемеровская область 1408,12 3030263,48 1982787,85 2372,243
Кировская область 109,39 130394,07 11966,39 743,8471
Костромская область 54,82 22092,06 3005,12 675,4224
Краснодарский край 150,15 325834,18 22546,22 794,9575
Красноярский край 2446,40 4254296,56 5984892,53 3674,094
Курганская область 58,01 43045,65 3365,51 679,4272
Курская область 36,88 40639,56 1359,99 652,9272
Ленинградская область 214,86 224527,66 46164,39 876,0874
Липецкая область 345,63 239865,14 119458,02 1040,05
Магаданская область 24,30 3864,18 590,64 637,1601
Московская область 193,64 622346,10 37494,90 849,4771
Мурманская область 280,56 85008,17 78711,11 958,4598
Ненецкий авт.округ 176,30 3349,64 31080,63 827,7367
Нижегородская область 160,57 279709,46 25782,08 808,015
Новгородская область 37,61 17753,34 1414,74 653,8488
Новосибирская область 233,49 310779,18 54518,98 899,4515
Омская область 214,18 241385,37 45874,79 875,241
Оренбургская область 646,81 924936,87 418361,88 1417,685
Орловская область 22,42 11143,73 502,75 634,8017
Пензенская область 21,70 17748,96 470,80 633,8939
Пермский край 321,87 500823,50 103597,72 1010,257
Приморский край 226,12 280836,07 51128,45 890,2019
Псковская область 20,75 12677,03 430,48 632,7027
Республика Адыгея 3,31 592,31 10,95 610,837
Республика Алтай 9,86 1755,44 97,26 619,0534
Республика Башкортостан 397,90 1236682,52 158326,80 1105,596
Республика Бурятия 96,25 73149,24 9263,87 727,3691
Республика Дагестан 19,53 33998,25 381,34 631,173
Республика Ингушетия 0,77 19,99 0,59 607,6522
Республика Калмыкия 2,21 247,52 4,88 609,459
Республика Карелия 105,52 39569,63 11134,26 738,9922
Республика Коми 598,28 327859,63 357943,74 1356,842
Республика Марий Эл 36,62 30357,98 1341,02 652,6037
Республика Мордовия 32,82 15818,76 1077,09 647,8379
Республика Саха (Якутия) 193,91 57977,60 37599,15 849,8144
Республика Северная Осетия-Алания 4,43 842,08 19,64 612,245
Республика Татарстан 268,26 537601,06 71965,57 943,0488
Республика Тыва 20,29 3287,47 411,81 632,1322
Республика Хакасия 96,16 36154,66 9245,98 727,2525
Ростовская область 175,24 265135,09 30708,36 826,4089
Рязанская область 131,79 99240,13 17369,39 771,9357
Самарская область 288,63 390515,04 83306,70 968,5833
Саратовская область 120,87 136700,58 14608,83 758,2362
Сахалинская область 115,82 36829,81 13413,58 751,9043
Свердловская область 1137,51 2869932,68 1293924,45 2032,944
Смоленская область 42,96 31233,37 1845,73 660,5556
Ставропольский край 64,24 61545,75 4127,29 687,2399
Тамбовская область 85,63 77582,59 7332,84 714,057
Тверская область 54,19 52619,46 2936,66 674,635
Томская область 359,96 215977,80 129573,36 1058,025
Тульская область 156,21 180270,96 24402,81 802,5558
Тюменская область 3267,85 4473682,54 10678824,02 4704,054
Удмуртская Республика 94,45 104083,90 8920,80 725,1134
Ульяновская область 31,33 20331,22 981,38 645,9671
Хабаровский край 114,42 87299,41 13091,02 750,1477
Ханты-Мансийский авт.округ-Югра 2201,04 1076306,60 4844559,47 3366,441
Челябинская область 798,38 1865818,73 637413,82 1607,733
Чеченская Республика 41,43 5758,21 1716,11 658,6297
Чувашская Республика 35,64 57803,21 1270,00 651,3712
Чукотский авт.округ 25,21 932,73 635,49 638,2961
Ямало-Ненецкий авт.округ 972,07 127341,56 944925,92 1825,515
Ярославская область 77,50 52003,84 6006,56 703,8633
Всего 22173,34 29221852,65 29228643,87 120658009,00 78157,00

 

 

Значения параметров a и b найдены по следующим формулам:

Видно, что расчетные значения признак-результата сильно отличаются от фактических, что свидетельствует о том, что выраженная линейная связь между данными двумя признаками отсутствует.

Построим империческую линию регрессии.

Рис3.1

Империческая линия регрессии.

 

Найдем коэффициент корреляции:

= 0,242

Вывод: Различными методами было обнаружено, что связь между величиной числа умерших от болезней органов дыхания и выбросами в атмосферу загрязняющих веществ, исходящих от стационарных источников в 83 регионах РФ на 2010 год, практически отсутствует.

 


 

Ряды динамики

В таблице 4.1 приведены данные о числе умерших от болезней органов дыхания в Псковской Области за период с 2000 по 2010 год.

Таблица 4.1

Число умерших от болезней органов дыхания в Псковской Области.

Годы Число умерших от болезней органов дыхания, чел.

 

Рассчитаем цепные и базисные показатели динамики по формулам:

– абсолютное изменение: Δц = уn – yn-1, Δб = yn – y0;

– коэффициенты роста: ;

– коэффициенты прироста: Кпр = Кр – 1;

– темпы роста и темпы прироста: Тр = Кр ∙ 100%, Тпр = Кпр ∙ 100%,

где уn – значение показателя в текущем периоде, yn-1 – в предыдущем периоде, а y0 – в базисном (2000 году) периоде.

Результаты занесены в таблицу 4.2.


 

Таблица 4.2

Цепные и базисные показатели динамики числа умерших от болезней органов дыхания в Псковской Области

Годы Число умерших, чел.. Δ Кпр Тр Тпр
ц б ц б ц б ц б ц б
- - - - - - - - - -
-20 -20 0,974 0,974 -0,026 -0,026 97,39% 97,39% -2,61% -2,61%
1,071 1,043 0,071 0,043 107,1% 104,3% 7,1% 4,3%
-35 -2 0,956 0,997 -0,044 -0,003 95,63% 99,74% -4,38% -0,26%
-43 -45 0,944 0,941 -0,056 -0,059 94,38% 94,13% -5,62% -5,87%
-56 -101 0,922 0,868 -0,078 -0,132 92,24% 86,83% -7,76% -13,17%
-10 -111 0,985 0,855 -0,015 -0,145 98,5% 85,53% -1,5% -14,47%
-84 -195 0,872 0,746 -0,128 -0,254 87,2% 74,58% -12,8% -25,42%
-146 1,086 0,81 0,086 -0,19 108,57% 80,96% 8,57% -19,04%
-10 -156 0,984 0,797 -0,016 -0,203 98,39% 79,66% -1,61% -20,34%
-93 -249 0,848 0,675 -0,152 -0,325 84,78% 67,54% -15,2% -32,46%

Из таблицы видно, что на протяжении всего рассматриваемого периода число умерших от болезней органов дыхания уменьшалось. Наибольшее абсолютное изменение числа умерших наблюдалось в 2010 г., когда данный показатель уменьшился на 93 чел. по сравнению с предыдущим годом. В этом же году наблюдался наименьший темп прироста числа умерших от болезней органов дыхания (32,46%).

 

Рассчитаем средние показатели ряда динамики.

1. Так как данный ряд динамики является интервальным, то средний уровень ряда можно вычислить по средней арифметической простой (n – число уровней ряда) :

 

2. Среднее абсолютное изменение – это среднее арифметическое от абсолютных изменений за каждый год. Его можно вычислить следующим образом:

 

3. Средний коэффициент роста – это среднее геометрическое из цепных коэффициентов роста за отдельные периоды времени динамического ряда. Используя связь между цепными и базисными показателями, его можно вычислить следующим образом:

Используя взаимосвязи между коэффициентами и темпами роста и прироста, находим эти средние показатели:

= ∙ 100% = 96,15%;

= – 1 = - 0,0385;

= ∙ 100% = -3,85%.

Итак, средний уровень числа умерших за рассматриваемые годы составил В среднем за каждый год числа умерших уменьшился на чел. Средний темп прироста фонда заработной платы в год составил -3,85%.

Произведем сглаживание ряда динамики методом трехлетней скользящей средней. Сглаженные уровни ряда будут считаться по формуле:

 

Произведем также аналитическое выравнивание ряда динамики по формуле , где – расчетные значения уровней ряда, а t – время, которое для удобства принимает значения –5, –4, … , 4, 5 (при этом средний уровень ряда соответствует t=0 и сумма всех значений t также равна нулю). Для расчета коэффициентов a и b составим таблицу 5.3, куда занесем также сглаженные уровни ряда методом скользящей средней.

Таблица 4.3

Сглаживание и аналитическое выравнивание ряда динамики

Годы Число умерших, чел. Условное обозначение времени Квадрат Произведение Расчетные значения
Символы y t t2 yt
-5 -3835 803,09
-4 -2988 777,84
-3 -2400 752,58
-2 -1530 727,33
-1 -722 702,07
676,82
651,56
626,31
601,05
575,80
550,55
Итого: -2778

 

Данные коэффициенты показывают, что средний уровень выровненного ряда динамики числа умерших составляет чел. Выровненные значения числа умерших равномерно убывают на чел. в год.

Графически фактический и выровненный ряды показаны на тренде ряда динамики (рис. 4.1)

Рис. 4.1

Тренд ряда динамики

Выборочное исследование

Допустим, что проведено бесповторное выборочное наблюдение в северо-западных регионах РФ по величине числа умерших от болезней органов дыхания. Данные и расчеты представлены в таблице 5.1

Таблица 5.1

Выборочное наблюдение по величине числа умерших от болезней органов дыхания

Северо-западные регионы РФ Величина числа умерших от болезней органов дыхания, чел. X - (X - 2
г.Санкт-Петербург 1313,45 1725162,84
Ленинградская область 403,45 162775,57
Вологодская область 109,45 11980,30
Архангельская область -16,55 273,75
Псковская область -30,55 933,02
Республика Коми -93,55 8750,75
Новгородская область -169,55 28745,66
Республика Карелия -266,55 71046,48
Калининградская область -288,55 83258,48
Мурманская область -338,55 114613,02
Ненецкий авт.округ -622,55 387562,84
Итого:   2595102,73

 

Где рассчитано по формуле:

= = 641,55 чел.

 

Найдем среднюю ошибку выборки по формуле:

где - дисперсия признака в выборочной совокупности, которая рассчитывается по формуле:

= = 235918,43

 

 

136,40 чел

 

На основании средней ошибки вычисляется предельная ошибка выборки Δ=tμ, где t – коэффициент Стьюдента. При вероятности 0,993 t=3, поэтому предельная ошибка будет равна

Δ=3∙136,40 =409,19 (чел.)

Тогда получаем границы изменения генеральной средней:

– Δ ≤ + Δ;

641,55 – 409,19 ≤ 641,55+409,19

232,35 ≤ 1050,74.

Найдем, какое количество регионов необходимо обследовать для того, чтобы снизить предельную ошибку выборки на 50%. Новая ошибка будет равна Δ’ = 0,5Δ = 204,60 чел., а новая выборочная совокупность будет содержать количество регионов, которое для бесповторного отбора находится по формуле:

В данном случае:

Итак, среднее значение величины числа умерших от болезней органов дыхания по всей генеральной совокупности с вероятностью 0,993 лежит в интервале от 232,35 до 1050,74 чел. Чтобы снизить предельную ошибку выборки на 50%, необходимо увеличить объем выборочной совокупности до 32 регионов.


 

Индексы

В таблице 6.1 представлены данные о выпуске в РФ продукции трех видов сахаpа-песка, макаронных изделий и муки за 2008 г. (базисный период) и 2009 г. (отчетный период). p0 и р1 - цены за единицу продукции в базисном и отчетном периоде соответственно, а q0 и q1 – объем продукции в тех же периодах.

Таблица 6.1

Данные о выпуске продукции по видам и ценам за 2008 и 2009 г.

Вид продукции 2008 г. 2009 г.
qo p0 p0q0 p1q0 q1 p1 p1q1 p0q1
Сахар-песок 25,07 147236,11 200269,3 34,1 171284,3 125926,61
Макаронные изделия 44,74 45947,98 43852,9 42,7 44749,6 46887,52
Мука 10,3 21,63 222,789 191,58 10,2 18,6 189,72 220,626
Итого 6910,3 91,44 193406,88 244313,78 6081,2 95,4 216223,62 173034,76

 

Определим индивидуальные индексы объема, цены и стоимости по каждому из трех видов продукции и проверим их взаимосвязь.

По сахар-песку:

По макаронным изделиям:

По муке:

Определим общие индексы физического объема и цены по методам Ласпейреса и Пааше, а также общий индекс стоимости.:

Результаты вычислений занесем в таблицу 6.2.

Таблица 6.2

Индексы физического объема, цены и стоимости

Индексы Вид продукции Общий
Сахар-песок Макаронные изделия Мука
Цены 1,36 0,95 0,86 1,2323
Физического объема 0,86 1,02 0,99 0,8947
Стоимости 1,16 0,97 0,85 1,118

 

Итак, в 2009 г. объем товарооборота на исследуемом предприятии увеличился на 11,8%, что произошло в результате увеличения стоимости сахара-песка на 16%, тогда как стоимости макаронных изделий и муки упали на 3% и 15% соответственно.

За счет изменения физического объема товарооборот уменьшился на 10,53%, что произошло в результате увеличения физического объема на макаронные изделия на 2%, при этом объемы сахара-песка и муки упали на 14% и 1 % соответственно.

За счет изменения цен товарооборот увеличился на 23,23%, что произошло в результате увеличения цены сахара-песка на 36%, при одновременном уменьшении цен макаронных изделий и муки на 5% и 14 %.

Определим индексы переменного состава, постоянного состава и структурных сдвигов.

.= = = 1,27

= = 1,25

= = 1,02

Итак, средняя цена производства увеличилась по сравнению с базисным годом на 27%. За счёт изменения цен на отдельные виды продукции средняя цена увеличилась на 25%, а за счет структурных сдвигов средняя цена увеличилась на 2%.