Ряд распределения рабочих по размеру заработной платы

 

Группа рабочих по зарплате, тенге Число рабочих
26000–28000
28000–30000
30000–32000
32000–34000
34000–36000
36000–38000
Итого

 

Модальным интервалом здесь является интервал, где варианта лежит в пределах от 34 до 36 тыс. тенге, поскольку наибольшее количество рабочих имеют заработную плату именно в этих пределах. Для расчета определенного значения модальной величины признака, заключенного в этом интервале, применяют такую формулу:

 

Mo = xMo + iMo × (fMo – fMo-1) / [(fMo – fMo-1) + (fMo – fMo+1)],

 

A) где xMo – минимальная граница модального интервала (в примере – 34000);

B) iMo – величина модального интервала (2000);

C) fMo-1 – частота интервала, предшествующего модальному (115);

D) fMo – частота модального интервала (180);

fMo+1 – частота интервала, следующего за модальным (45).

 

Рассчитаем значение моды для нашего примера:

 

Mo = 34000 + 2000 × (180 – 115) / [(180 – 115) + (180 – 45)] = 34000 +2000 × 65/200 = 34000 + 2000 × 0,325 = 34650 тенге.

 

Смысл формулы заключается в том, что величину той части модального интервала, которую нужно добавить к его минимальной границе, определяют в зависимости от величины частот предшествующего и последующего интервалов. В данном случае к 34000 прибавляем 650, т.е. меньше половины интервала (2000), потому что частота предшествующего интервала (115) больше частоты последующего интервала (45).

Расчет медианы в интервальном вариационном ряду. Для исчисления медианы сначала необходимо определить интервал, в котором она находится (медианный интервал). Это интервал, кумулятивная частота которого будет превышать половину суммы частот. Половина частот в нашем случае равна 250 (500 / 2). Суммируя последовательно частоты в ряду, мы превысим середину суммы частот на четвертом интервале (10 + 50 + 100 + 115 = 275), т.е. медианным у нас будет интервал 32000–34000 тенге. До этого интервала сумма частот составила 160. Для получения медианы необходимо прибавить еще 90 единиц (250 – 160).

При определении медианы предполагают, что значение единиц в границах интервала распределяется равномерно. Следовательно, если 115 единиц, находящихся в этом интервале, распределяются равномерно в интервале, равном 2000, то 90 единицам будет соответствовать следующая его величина:

2000 × 90 / 115 = 1560.

 

Прибавив полученную величину к минимальной границе медианного интервала, получим искомое значение медианы:

 

Me = 32000 + 1560 =33560 тенге.

 

Формула для исчисления медианы для интервального вариационного ряда будет иметь вид:

 

Me = xMe + iMe × (Sf/2 – SMe-1) / fMe,

 

где xMe – начальное значение медианного интервала;

iMe – величина медианного интервала;

Sf – сумма частот ряда (численность ряда);

SMe-1 – сумма накопленных частот в интервалах, предшествующих медианному;

fMe – частота медианного интервала.

 

Рассчитаем медиану для нашего случая:

 

Me = 32000 + 2000 × (500/2 – 160)/115 = 33560 тенге.

 

Таким образом, для нашего примера средняя арифметическая равна 33160, мода – 34650, медиана – 33560 тенге. Соотношение этих трех величин указывает направление и степень асимметрии распределения (будет рассмотрено в следующей теме).

Квартили и децили. Дополнительно к медиане для характеристики структуры вариационного ряда исчисляют квартили, делящие ряд по сумме частот на 4 равные части, и децили, которые делят ряд по сумме частот на 10 равных частей.

Второй квартиль равен медиане, а первый и третий исчисляются аналогично расчету медианы, только вместо медианного интервала берется для первого квартиля интервал, в котором находится варианта, отсекающая ¼ численности частот, а для третьего квартиля – варианта, отсекающая ¾ численности частот. Рассчитаем для нашего примера первый и третий квартили:

Q1 = xQ1 + i Q1 × (Sf/4 – S Q1-1) / f Q1 = 30000 + 2000 × (125 – 60) / 100 = 31300 тенге.

 

Четвертая часть частот составляет 125 (500/4) и находится в интервале 30000–32000. Следовательно, xQ1 = 30000. Сумма накопленных частот до данного интервала равна 60 (SQ1-1), частота этого интервала – 100 (fQ1). Полученное значение первого квартиля означает, что у трех четвертей рабочих заработная плата составляет 31300 тенге и выше (или у одной четверти рабочих она не превышает 31300 тенге).

Рассчитаем третий квартиль:

 

Q3 = xQ3 + i Q3 × (S3f/4 – S Q3-1) / f Q3 = 34000 + 2000 × (375 – 275) / 100 = 35110 тенге.

 

Следовательно, заработная плата каждого четвертого рабочего превышает 35110 тенге (или у трех четвертей рабочих она не превышает 35110 тенге).

Нахождение моды и медианы в дискретном вариационном ряду.Рассмотрим распределение семей в некотором населенном пункте по количеству детей:

Ряд распределения семей по количеству детей

Группа семей по числу детей Число семей
Итого

Модой в этом примере будет семья, имеющая двоих детей, так как этому значению варианты соответствует наибольшее число семей (75).

Если распределение равномерное, где все варианты встречаются одинаково часто, то говорят, что ряд не имеет моды или, иначе, что все варианты одинаково модальны.

Могут быть случаи, когда две варианты встречаются одинаково часто. Тогда говорят, что распределение бимодально.

Для нахождения медианы необходимо сумму частот разделить пополам и к полученному результату прибавить 0,5. В нашем случае это будет 101 варианта (201/2 + 0,5). Данная варианта находится в группе семей с двумя детьми, т.е. медианой будет семья, имеющая двух детей.

Если в ряду имеется четное количество частот (например, 200), то номер медианной варианты будет дробным (для 200 будет 200,5). В этом случае медиана находится между 100-й и 101-й вариантами, а ее значение будет равно средней из значений этих двух вариант.[kgl]

 

[g1]Тема7. Выборочное наблюдение[:]

Цель занятия: Целесообразно сначала прорешать оба варианта задач, в которых рассматривается собственно-случайная выборка, а уже после этого переходить к задачам на другие виды выборки – механическую, типическую и серийную. При решении ряда задач можно использовать несколько уровней вероятности, чтобы студенты могли оценить их влияние на получаемые минимальные объемы выборки и границы генеральных характеристик.

Структура лекции: Представленные задачи по данной теме должны соответствовать двум возможным стадиям выборочного наблюдения, которые должны быть четко поняты студентами:

А) наблюдение уже проведено при заданном объеме выборки или проценте отбора; требуется определить границы генеральных характеристик на основе расчета выборочных характеристик и их ошибок;

Б) наблюдение планируется; необходимо определить тот минимальный объем выборки, который обеспечит требуемую точность при последующем определении границ генеральных характеристик.

Статистическое наблюдение по охвату единиц совокупности подразделяется на:

1) сплошное – обследованию подвергаются все единицы совокупности;

2) несплошное – обследованию подвергается часть единиц совокупности.

Несплошное наблюдение подразделяется на три способа:

1) основного массива;

2) выборочного наблюдения;

3) монографический.

Понятие о выборочном наблюдении и его задачах.Выборочным наблюдением называется разновидность несплошного наблюдения, при котором производится наблюдение некоторой части генеральной (всей) совокупности, отобранной в случайном порядке. Этим обеспечивается репрезентативность выборочной совокупности, т.е. свойство воспроизводить всю генеральную совокупность.

Выборочные наблюдения позволяют при меньших затратах сил, средств и времени получить репрезентативные данные обо всей совокупности наблюдаемых единиц. В то же время, поскольку данные собираются по части совокупности, а выводы делаются обо всей совокупности, то возможна ошибка, называемая ошибкой репрезентативности. При выборочном наблюдении важно обеспечить получение результатов с приемлемой ошибкой выборки.

 

Генеральная и выборочная совокупность, доля и средняя. Вся совокупность наблюдаемых единиц называется генеральной совокупностью, а ее численность обозначается N. Выборочная совокупность – это часть совокупности, подвергаемой выборочному обследованию, ее численность обозначается n.

При выборочном наблюдении имеют дело с двумя категориями обобщающих показателей: долей и средней величиной. Доля дает характеристику совокупности по альтернативно варьирующему признаку и исчисляется как отношение числа единиц совокупности, обладающих интересующим нас признаком, к общему числу единиц совокупности. Например, при изучении качества продукции определяют относительную долю тех единиц ее, которые не выдерживают установленного стандарта качеств, т.е. относятся к браку. При изучении совокупностей студентов нас может интересовать доля в этой совокупности студентов-отличников.

Доля в генеральной совокупности обозначается латинской буквой p, а доля в выборочной совокупности – w и называется частостью. Задача выборочного наблюдения в данном случае состоит в том, чтобы на основе измерения частости (выборочной доли) дать правильное представление о доле в генеральной совокупности.

Среднее значение варьирующего признака во всей совокупности называется генеральной средней `X, а среднее значение признака у единиц, которые подверглись выборочному наблюдению – выборочной средней `x. С этой точки зрения задача выборочного наблюдения состоит в том, чтобы на основе выборочной средней дать правильное представление о средней генеральной.

Понятие об ошибке выборки. Поскольку в результате выборочного наблюдения сводные показатели получаются только на базе выборочной совокупности, то они почти никогда не совпадают со сводными показателями всех единиц совокупности. Поэтому важно знать возможные пределы отклонений этих показателей и условия, от которых зависит величина таких отклонений.

Возможные пределы отклонений выборочной доли и выборочной средней от доли и средней в генеральной совокупности носят название ошибки выборки.

Следует различать ошибки выборки и ошибки регистрации.