ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛИЯ

12
Далее ⇒

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

НОВГОРОДСКИЙ ФИЛИАЛ ГОУ ВПО САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСВТЕННЫЙ УНИВЕРСИТЕТ СЕРВИСА И ЭКОНОМИКИ

КАФЕДРА «СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ДИСЦИПЛИН»

Л.И. Бернасовская

СТАТИСТИКА

Домашние задания № 1 и методические указания

по теме «Анализ одномерных рядов распределения»

Для студентов очной формы обучения

Специальности 080502

«Экономика и управление на предприятии в сфере сервиса»

Учебное пособие

ВЕЛИКИЙ НОВГОРОД

Утверждены на заседании кафедры «Социально-экономических дисциплин», протокол № 1,от 29.08.2006г.

Утверждены методическим Советом НФ СПбГУСЭ, протокол № 1,

от 07.09. 2006г.

Статистика. Домашние задания № 1 и методические указания по теме «Анализ одномерных рядов распределения» для студентов очной формы обучения специальности 080502/ Учебное пособие СПбГУСЭ: Великий Новгород, 2006. - 29 с.

Автор: канд. экон. наук Бернасовская Л.И.

Рецензент: канд. экон. наук О.Д. Притула

В учебном пособии разработаны 25 задач по статистике, приведены методические указания по их решению, прилагаются статистические таблицы, необходимые для оценки статистических гипотез.

Пособие предназначено для студентов дневной формы обучения и может быть широко использовано для студентов заочного отделения.

ÓНовгородский филиал ГОУ ВПО Санкт-Петербургский государственный университет сервиса и экономики

СОДЕРЖАНИЕ

1.Указания для выбора домашних заданий………………………………...4

2. Вариационные ряды распределения..............................................…….....4

3. Условия для задач 1-25 и задания……………………………………….15

4. Список литературы.....................................................................................24

5. Приложение А…………………………………………………………….25

6. Приложение Б……………………………………………………………..26

7. Приложение В……………………………………………………………..27

8. Приложение Г……………………………………………………………...28

9. Приложение Д……………………………………………………………...30

Указания для выбора домашних заданий

В процессе изучения общего курса статистики студент выполняет и в установленные для него сроки представляет домашнюю работу, позволяющую укрепить практические навыки в проведении статистического анализа одномерных рядов распределения.

Цель домашней работы - выявить, в какой степени студентом усвоен учебный материал, умеет ли он применять на практике изученные приемы обработки статистических данных.

Выполняя работу, студент должен подробно выполнить все расчеты, не ограничиваясь только приведением ответов; применяя формулы, необходимо привести эти формулы и указать, что обозначают символы; сформулировать краткие выводы. Расчеты могут быть выполнены вручную или с применением компьютеров.

В конце работы необходимо поместить список использованной литературы.

Все страницы работы следует пронумеровать и на них оставить поля; работа должна быть написана аккуратно и разборчиво, либо отпечатана. На титульном листе написать фамилию, имя и отчество полностью, факультет, курс, домашний адрес, номер зачетной книжки.

Настоящее задание содержит 25 отдельных задач.

Замена задач при выполнении домашней работы не допускается. Студент должен представлять решение именно той задачи, номер которой соответствуют его порядковому номеру в журнале.

По всем вопросам, возникающим при выполнении настоящей домашней работы, следует обращаться на кафедру СЭД.

ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛИЯ

МЕТОДИЧЕСКИЕ УКАЗАНИЯ К РЕШЕНИЮ ТИПОВЫХЗАДАЧ

Группировка позволяет получить такие результаты, по которым выявляется состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи.

Первым и наиболее простым способом обобщения статистических данных являются ряды распределения.

Статистическим рядом распределения называют численное распределение единиц совокупности по изучаемому признаку. В зависимости от признака ряды могут быть вариационные (количественные) и атрибутивные.

Количественные признаки - это признаки, имеющие количественное выражение у отдельных единиц совокупности.

Атрибутивные признаки - это признаки, не имеющие количественной меры (качественные признаки).

Вариационные ряды могут быть дискретными или непрерывными. Дискретный ряд распределения - это ряд, в котором численное распределение признака выражено одним конечным числом, например, распределение рабочих по разрядам:

Тарифный разряд Число рабочих, чел.

Непрерывные ряды распределения - это ряды, в которых непрерывные признаки могут отличаться друг от друга на сколь угодно малую величину и в определенных границах принимать любые значения, например, заработная плата рабочих, стоимость основных производственных фондов и др. Когда число вариант рядов велико для дискретного признака и значения вариант не повторяются для непрерывного признака, строятся интервальные ряды распределения.

Интервальный ряд распределения это ряд, в котором значения признака заданы в виде интервала, например, предыдущий пример можно представить в виде интервала:

Тарифный разряд Число рабочих, чел.

1 – 2

3 – 4

5 – 6

При построении интервальных рядов распределения необходимо определить число групп, какие взять интервалы (равные, неравные, закрытые, открытые).

Число групп можно определить по формуле:

n = 1 + 3,332 lg N

где N - число единиц совокупности;

n - число групп.

Специальные методические исследования позволили установить, что наиболее четко закономерности выступают в количественных группировках, в которых не более 7 - 10 групп.

Для определения оптимального числа групп в зависимости от количества наблюдений можно воспользоваться следующей шкалой:

Число наблюдений Оптимальное число групп

до 40

40 – 60 3 – 4

60 – 100 4 – 5

100 – 300 5 – 7

свыше 300 8 – 10

Равные интервалы применяют в том случае, когда максимальное значение признака превышает не более, чем в 10 раз минимальное значение и интервал определяют:

При большом колебании группировочного признака используют неравные интервалы, построенные на принципе кратности. Обычно последующие интервалы возрастают в 2-3 раза. Их недостаток заключается в том, что объекты с разным уровнем экономического развития часто попадают в одну группу. Избежать этого можно путем применения специализированных интервалов, т.е. интервалов, отображающих экономическое содержание групп.

По построению интервалы бывают замкнутые и открытые. В замкнутых (закрытых) интервалах верхняя и нижняя границы их имеют определенное числовое выражение, например, заработная плата на одного рабочего 600-700 рублей, 700-800 рублей, 800-900 рублей и т.д.

В открытых интервалах нижняя и верхняя группы не имеют строго очерченных численных границ, например:

Группы магазинов по объему товарооборота, млн. руб. Количество магазинов

до 25

25-50

50-120

120-180

180 и более

Итого

После образования интервалов необходимо образовать группы частот (повторяемости явлений). Это возможно на основе различных методик. Наиболее простая сводится к тому, что предварительно составляется ранжированный ряд распределения, то есть ряд, в котором значение признака располагается в возрастающем или убывающем порядке и счет ведется по группам.

Применение средних и индивидуальных величин для характеристики изучаемой совокупности - необходимый прием разработки рациональных группировок.

Для дискретного ряда распределения средняя арифметическая исчисляется по формуле:

(простая средняя арифметическая).

Для интервальных рядов средняя арифметическая определяется:

(взвешенная средняя арифметическая),

где - варианты;

n - число наблюдений;

f - частота (вес или повторение).

Вариационный ряд характеризуется еще двумя средними показателями – медианой и модой. Медиана - показатель средней величины вариационного ряда. Она определяется по формуле:

где f_me - нижняя граница медианного интервала;

i - величина интервала;

S_me_-1 - сумма накопленных частот до медианного интервала.

Мода – это величина признака с максимальной частотой, определяется по формуле:

,

где f_mo – частота модального интервала;

f_mo_-1– частота предмодального интервала;

f_mo₊₁– частота послемодального интервала.

На основе рассчитанных значений средних величин необходимо сделать вывод о согласованности данного эмпирического ряда распределения нормальному распределению.

Если эмпирический ряд согласуется с нормальным распределением.

Для умеренно асимметричных рядов справедливо соотношение

Абсолютные величины каждой изучаемой единицы совокупности различны, что связано с влиянием на нее большого количества различных факторов. Свойство единиц отличаться друг от друга называют изменчивостью признака. Для погашения индивидуальных отклонений используют средние величины, характеризующие основные свойства изучаемых объектов.

Однако средних величин недостаточно. Для характеристики совокупности нужно знать, как группируются признаки вокруг средней величины для чего используются показатели среднего квадратического отклонения и коэффициента вариации.

Среднее квадратическое отклонение характеризует степень изменчивости признака в абсолютных величинах и определяется по формуле:

(для дискретного ряда)

для интервального ряда

Для нормального ряда распределения отклонение от средней ( ) относят на три сигмы (3s) влево и вправо.

Порядок расчета среднеквадратического отклонения:

а) рассчитывают среднюю арифметическую ( );

б) определяют отклонения от средней величины (х- );

в) отклонения возводят в квадрат (х- )²;

г) квадрат каждого отклонения умножают на частоту (х- )²f;

д) суммируют произведение квадратов отклонений от средней величины на частоту ;

е) сумму отклонений делят на сумму частот

;

ж) определяют среднее квадратическое отклонение:

Изменчивость признака в вариационных рядах можно определить не только в абсолютных, но и в относительных величинах. Коэффициент вариации определяется по формуле:

или

Он показывает, на сколько процентов в среднем отклоняются значения признака ряда от средней величины. Изменчивость признака считается незначительной, если коэффициент вариации не более 10%. При коэффициенте вариации от 11 до 30% изменчивость будет средней, а свыше 30 - большой. Исследования показывают, что при коэффициенте вариации не более 15% нет необходимости определять степень достоверности получения статистических данных и ряд является однородным. По мнению других авторов [4] эти границы могут несколько отличаться, но не существенно. Если ряд не однороден, то необходимо провести первичную статистическую обработку.

В учебных целях в се студенты проверяют эмпирический ряд на однородность по F –критерию, независимо от того, какой получился коэффициент вариации.

Проверка ряда на однородность осуществляется следующим образом: разбивается ряд на две выборки, например, n₁ = 11_,n ₂= 8.По этим выборкам определяются дисперсии. Так, пусть s₁²= 2267, s₂²= 700,6. На основе рассчитанных дисперсий определяется расчетное значеие F – критерия. В нашем случае F_расч.=s₁²/s₂²= 2267/700,6 = 3,23. Это значение срвнивается с теоретическим значением F-критерия при определенном уровне значимости (5% или 1%) и числе степеней свободы, числителя V₁= n₁– k – 1 и знаменателя V₂= n₂– k – 1 по таблицам (приложение Е). У нас V₁= 8, V₂= 5, F _табл.= 4,82. Так как F_расч.= 3,23 < F_табл. = 4,82, то выборки следует признать однородными и исследование в дальнейшем вести по эмпирическому ряду в целом. Если F_расч. > F_табл., то исследование в дальнейшем следует проводить раздельно по двум выборкам. Необходимо только запомнить, что в числителе F – критерия всегда должна стоять большая дисперсия.

Для подтверждения достоверности информации необходимо кроме проверки ее на однородность исключить аномальные наблюдения (резко выделяющиеся). Имеется несколько методов для проведения этой процедуры. Воспользуемся наиболее простым методом расчета обнаружения грубых ошибок с помощью Т –критерия Граббса, для чего рассчитывается:

, где

Т_н– расчетное значение Т-критерия;

х – подозреваемое значение в эмпирическом ряду (минимальное или максимальное);

- среднее значение;

s - среднеквадратическое отклонение.

Расчетное значение Т_нсравнивается с табличным (приложение Г) при определенной вероятности и заданном объеме информации. Если Т_н³ Т_кр., то в эмпирическом ряду есть выбросы ( аномальные наблюдения) и их необходимо исключить из дальнейшего исследования, если Т_н < Т_кр., то данные не сильно расходятся и большого искажающего эффекта не будет. Студент проверяет одно минимальное и одно максимальное значение признака. После проверки информации на достоверность продолжают проверку ряда на согласованность нормальному распределению по показателям асимметрии и эксцесса. Фактические данные могут несколько отличатся от нормального распределения и иметь асимметрию и эксцесс и возникает вопрос на сколько велики эти расхождения. Чтобы ответить на этот вопрос рассчитывается коэффициенты асимметрии и эксцесса. Коэффициент асимметрии и эксцесса определяется по формуле;

, где

m³– момент третьего порядка.

Если коэффициент асимметрии получается положительным, то это правосторонняя асимметрия, отрицательным – левосторонняя. Следующие количественные значения свидетельствуют величине асимметрии:

As < 0.5 – малая асимметрия;

0.5 < As < 1 - средняя асимметрия;

As > 1 - большая асимметрия.

В нормальном распределении As = 0.

Эксцесс – это какие-то глубинные причины, которые уменьшают (увеличивают) частоты на концах ряда, в результате появляется в ряду островершинность (низковершинность). Коэффициент эксцесса определяется по формуле:

, где

m⁴– момент четвертого порядка.

Плюс (+) свидетельствует об островершинности, а минус (-) – о низковершинности (плосковершинности). Если Еs приближается k ±0.4 – это незначительное накопление частот, фактическое распределение согласуется с нормальным; Еs >3,5 – это большой коэффициент свидетельствует о сниженной изменчивости признака; Es - > - 2 – появляется 2 вершинности, что свидетельствует о неоднородности ряда.

Если значения коэффициента находится в указанных пределах, то необходимо далее оценить соответствие эмпирического ряда нормальному распределению по одному из критериев согласия.

Существуют их несколько:

- критерий А.Н. Колмогорова;

- критерий (хи- квадрат);

- критерий В.И. Романовского;

- критерий Ястремского и др.

Рассмотрим оценку ряда распределения на основе критерия А.Н. Колмогорова. Он основан на сравнении кумулятивных частот в вариационном ряду D_факт.с теоретической величиной D_теор.=

где D_факт. - максимальное отклонение суммы фактических частот от суммы теоретических частот;

n - число уровней ряда.

А.Н. Колмогоров установил, что когда n неограниченно возрастает, вероятность того, что D будет меньше величины приближается к значениям функции . По таблицам вероятностей k(l) находят величину l, соответствующую данной величине вероятности k(l).

Порядок расчета критерия Колмогорова:

а) определяются отклонения от средней величины (х- );

б) рассчитывается среднее квадратическое отклонение;

;

в) определяется нормированное отклонение;

г) в зависимости от расчетного значения t по таблицам значения функции нормального распределения (приложение А) находим значение f_t (f - табличное);

д) рассчитывается теоретические значения частот f_теор.по формуле:

где i - интервал;

n - число наблюдений;

s - среднеквадратическое отклонение;

е) определяются кумулятивные фактические и теоретически частоты;

ж) на основе фактических и теоретических частот рассчитывается разница ;

з) рассчитывается критерий Колмогорова для определения соответствия эмпирического распределения нормальному.

С этой целью задается уровень значимости a, например, a=5% уровнем, наиболее часто используемом экономистами. Для этого уровня значимости по таблицам значений функции А.Н. Колмогорова (приложение Б) находится l=1,36. Зная количество уровней ряда n находится . На основе рассчитанной разницы фактических и теоретических частот (пункт ж) выбирается абсолютная максимальная величина D. Она сравнивается со значением . Если D< , то с вероятностью Р, равной 1-a, то есть в нашем случае 1-0,05=0,95, можно утверждать, что рассматриваемое распределение следует закону нормального распределения. Если же D> , то эмпирическое распределение не следует закону нормального распределения.
12
Далее ⇒