ГРАФИЧЕСКИЕ ИЗОБРАЖЕНИЯ В СТАТИСТИКЕ

 

В статистике графиком называют наглядное изображение статистических величин при помощи точек, геометрических линий и фигур.

Всем весьма разнообразным видам графических изображений свойственны следующие общие элементы: а) система координат; б) шкала; в) масштаб; г) координатная сетка; д) графический рисунок; е) заголовок; ж) цифровые данные; з) разъяснение условных обозначений.

Для размещения геометрических знаков, выражающих статистические данные, необходима система координат. Наиболее часто для этой цели используется система прямоугольных координат. При этом необходимо соблюдать соотношение масштаба по осям абсцисс и ординат. Рекомендуемые соотношения: от 1:1 до 1,6:1. Последнее соотношение известно под названием золотого сечения.

При построении статистических графиков могут применяться полярная система координат, географические карты.

Шкала – это линия, отдельные точки которой могут быть в соответствии с принятым масштабом прочитаны как определенное значение статистического показателя. Шкала на графике может быть прямолинейной или криволинейной, равномерной (арифметической) или неравномерной (логарифмической).

Масштабом графика называется угловая мера перевода числовой величины в графическую. Масштаб выбирается так, чтобы на графике могла уместиться наибольшая величина показателя и одновременно была ясно различима наименьшая его величина. При этом цифровые обозначения абсолютных величин по вертикальной оси должны обязательно начинаться с нуля. Для увеличения наглядности допускают исключения части поля графика («разрыв» показывается волнистой линией).

Координатная сетка определяет пространственные ориентиры графика (например, система прямоугольных координат, географические ориентиры, границы государств и их частей).

Графический рисунок (образ) – это совокупность линий, точек, фигур различной формы, штриховки или окраски, которыми изображаются статистические данные.

Заголовок графика должен ясно, кратко и точно отражать его содержание, единицы измерения, время и место, к которым относятся изображаемые данные.

Цифровые данные, используемые на графике, проставляются либо непосредственно у геометрических фигур (точек) чертежа, либо приводятся в виде небольшой таблицы.

Применяемые на графике условные обозначения должны быть разъяснены.

Статистические графики могут быть сгруппированы по различным признакам: по пространственной ориентации, форме графического образа, типу шкалы, задачам изображения и т. д.

По пространственной ориентации (виду поля графика) различают диаграммы и статистические карты (картограммы).

Диаграмма – это графическое изображение, наглядно показывающее соотношение между сравниваемыми величинами.

По форме графического образа различают диаграммы линейные, столбиковые, полосовые (ленточные), квадратные, круговые, секторные, иллюстрированные (или фигурные).

Линейные диаграммы выражают статистические величины посредством линий на координатном поле. По оси абсцисс откладывается время или факториальные (независимые) признаки, а по оси ординат – размеры результативного (зависимого) признака. Столбиковые и полосовые (ленточные) диаграммы изображают статистические данные в виде прямоугольников одинаковой ширины, расположенных вертикально (тогда диаграмма называется столбиковой) или горизонтально (называется полосовой или ленточной). Высота (длина) прямоугольников пропорциональна изображаемым ими величинам.

Квадратные и круговые диаграммы, площадь каждой из которых выражает величину изображаемого явления, строятся со сторонами квадрата или радиуса круга, исчисляемыми как корень квадратный из статистической величины с учетом принятого масштаба. При определении радиуса круга статистическая величина предварительно делится на = 3,14.

Секторная диаграмма представляет собой круг, разделенный на секторы, величина которых соответствует изображаемым частям целого.

Иллюстрированные (или фигурные) диаграммы строятся по методу фигур-знаков. Изображаемые величины представляются определенным количеством одинаковых по размеру фигур или схематических рисунков, соответствующих содержанию изображаемого явления.

 

 

Картограмма представляет собой контурную географическую карту, на которой с помощью штриховки или окраски показана степень интенсивности распространения явления (например, плотность населения, плотность предприятий).

 

 

Если на каждую карту нанесены абсолютные величины явления в виде диаграмм, то полученное графическое изображение называется картодиаграммой.

Графические изображения являются не только средством наглядного представления статистических данных, но и методом их анализа. Графики облегчают восприятие статистических величин, помогают сразу охватить весь набор данных, выявить наиболее характерные соотношения и связи, уловить основные тенденции и колеблемость в развитии, охарактеризовать территориальную распространенность явлений.

При построении графика одинаково важно все – правильный выбор вида графического изображения статистических величин, соблюдение правил построения, грамотный анализ графических изображений.

 

Задача № 1.Изобразите данные, приведенныев нижеследующей таблице, графически при помощи столбиковой диаграммы.

Исходные данные

 

Годы Количество оборудования, тыс. единиц
всех в том числе автоматического

 

Задача № 2.Изобразите графически при помощи секторной диаграммы структуру радиоприемных точек за два года.

 

Исходные данные

 

Годы Соотношение радиоприемных точек, %
радиоприемников телевизоров трансляционных точек
1-й 23,9 4,3 71,8
2-й 43,1 7,7 49,2

Задача № 3. При помощи столбиковой и секторной диаграмм изобразить графически следующие данные, %.

 

Годы Вся валовая продукция региона В том числе
производство средств производства производство предметов потребления
39,5 60,5
60,5 39,5
75,5 21,5

 

Задача № 4.Постройте линейный график по данным о темпах роста промышленной продукции в странах А и Б, приведенным в нижеследующей таблице:

 

Страны Темпы роста промышленной продукции, % к 1950 г.
1950 г. 1960 г. 1965 г. 1968 г. 1969 г.
А
Б

 

Задача № 5.При помощи полосковой диаграммы изобразить графически состав доходов рабочих в зависимости от суммы среднегодового дохода по следующим исходным данным:

 

Группы семей по уровню средне-душевого дохода за год, тыс. руб. Удельный вес в доходах, %
Заработная плата работающих Пенсии и пособия из обществ. фондов Прочие доходы Всего
До 500
500,1 – 600
600,1 – 900
900,1 – 1200
1200,1 – 1560
1500,1 и более

 

 

Задача № 6.Постройте столбиковую и круговую (секторную) диаграмму по данным о распределении числа студентов в области по видам обучения.

 

Исходные данные

 

Вид обучения Количество студентов
тыс. чел. % к итогу
1992/93 г. 1993/94 г. 1994/95 г. 1992/93 г. 1993/94 г. 1994/95 г.
На дневных отделениях 15,8 17,4 18,9 47,2 48,7 50,4
На вечерних отделениях 0,6 0,7 0,8 1,8 2,0 2,1
На заочных отделениях 17,1 17,6 17,8 51,0 49,3 47,5
Всего 33,5 35,7 37,5

 

Задача № 7.Построить аналитическую диаграмму зависимости рентабельности производства от уровня производительности труда по следующим данным:

 

Средняя производительность труда, млн. руб./ чел. 1,05 1,35 1,65 1,95 2,25 2,55
Средняя рентабельность производства, % - 13,8 20,4 51,4 72,7 87,8 95,8

 

Задача № 8.Пользуясь фигурной (картинной) диаграммой, изобразите изменение письменного обмена области за 1940 и 1990 г., который составил соответственно 2,6 млн. и 9 млн. писем.

 

Задача № 9. Построить гистограмму распределения 60 рабочих по стажу работы.

Исходные данные

 

Стаж работы Численность рабочих Накопленная численность рабочих
Абсолютная % к итогу
До 2 лет 6,65
2 - 4 8,35
4 - 6 10,0
6 - 8 16,7
8 – 10 25,0
10 – 12 15,0
12 – 14 11,65
14 и более лет 6,65
Итого -

 

Задача № 10.Построить полигон распределения рабочих по тарифным разрядам.

Исходные данные

 

Тарифный разряд Численность рабочих
абсолютная % к итогу
5,0
8,3
16,7
25,0
25,0
6,7
8,3
5,0
Итого

 

Задача № 11.Капитальные вложения, ввод в действие основных фондов в сопоставимых ценах и национальный доход страны характеризуется следующими данными, трлн. руб.

 

Показатель Годы пятилетки
1-й 2-й 3-й 4-й 5-й
Все капитальные вложения 64,2 92,2 128,4 150,9 156,5
Ввод в действие основных фондов 58,9 87,4 120,2 148,9 149,4
Национальный доход (в фактически действующих ценах) 192,9 289,9 363,2 462,2 486,7

 

Построенные линейные графики (все кривые) нанести на одну диаграмму. Какие выводы можно сделать, рассматривая построенную диаграмму?

 

Задача № 12.По данным о протяженности электрифицированных линий железных дорог (на конец года) постройте диаграммы: а) ленточные; б) структурные.

Исходные данные

 

Протяженность электрифицированных линий железных дорог
В тыс. км 1,9 33,9 43,7 46,8
В % к общей эксплуатационной длине дорог 1,8 25,0 30,8 32,6

 

Задача № 13.По данным о распределении численности рабочих отрасли по тарифным разрядам за год постройте полигон распределения:

Тарифный разряд
Численность рабочих, % к итогу 4,3 8,1 12,6 32,4 17,0 14,0 6,6 5,0

 

Задача № 14.По данным о распределении сельскохозяйственных предприятий по числу дворов в 1992 г. постройте полигон и гистограмму распределения:

 

Группа предприятий по числу дворов До 201 201 – 300 301 – 500 Свыше 500
Число сельхозпредприятий, % к итогу 13,6 19,0 31,7 35,7

 

Задача № 15.Используя нижеприведенные исходные данные построить кумулятивную кривую (кумуляту) вариационного ряда.

 

Группа семей по числу детей 4 и более
Численность семей, % к итогу 20,5 38,6 27,4 8,3 5,2

 

Контрольные вопросы

 

1. С какой целью используются графические построения в статистике?

2. Какие основные элементы содержит любой график? Раскройте назначение и дайте краткую характеристику каждому из них.

3. Что собой представляет статистический график? Назовите основные виды графиков.

4. Раскройте правила построения столбиковых и полосовых (ленточных) графиков. В чем состоят сходства и различия в их построении?

5. Дайте характеристику линейным, квадратным, круговым и фигурным диаграммам.

6. какие виды графиков Вам известны из предыдущих тем по данной дисциплине? Вспомните правила их построения.

 

ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ

 

Выборочное наблюдение является наиболее совершенным и широко применяемым видом несплошного наблюдения. Отбор подлежащих обследованию единиц генеральной (всей) совокупности организуется по принципу случайного отбора. Случайный отбор может быть проведен в двух формах: возвратной (повторной) выборки и безвозвратной (бесповторной) выборки. В первом случае отобранный номер снова возвращается в генеральную совокупность и может быть выбран повторно; во втором случае выбранные номера вычеркиваются из списка и каждая данная единица совокупности может быть включена в выборочную совокупность только один раз.

Полученные по выборочной совокупности (выборке) статистические характеристики распространяются на генеральную совокупность.

Репрезентативность выборки зависит от способа отбора и объема выборки.

Основными способами отбора являются: собственно-случайный, механический, типический, серийный (гнездовой), многоступенчатый (комбинированный) отбор.

Собственно-случайный отборможет производиться на основе жеребьевки (лотереи) или по таблицам случайных чисел.

При механическом способегенеральная совокупность делится на n равных частей (по объему выборки) и из каждой части отбирается в определенном порядке одна единица (например, последняя).

При типическом способегенеральная совокупность вначале расчленяется на типические группы. Затем из каждой группы собственно-случайным или механическим способом производится отбор единиц в выборочную совокупность. Применяется принцип пропорциональности отбора.

При серийном (гнездовом) способевместо отдельных единиц собственно-случайным или механическим способом отбирают целые их серии (гнезда, пачки, коробки, ящики и т.п.) и внутри этих серий обследуется все без исключения единицы.

Многоступенчатый (комбинированный) способ предполагает отбор из генеральной совокупности крупных групп, а из состава их более мелких групп и внутри последних отдельных единиц совокупности.

Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки (μ).

Возможная ошибка собственно случайной выборки определяется по формулам:

а) при повторном отборе:

;

б) при бесповторном отборе:

,

где - дисперсия выборочной совокупности;

n - объем (число единиц) выборки;

N - объем генеральной совокупности.

При определении ошибки выборки для типического отбора в приведенных формулах вместо используется средняя внутригрупповая дисперсия:

 

 

где i – дисперсия типической i-й группы;

ni – количество единиц в i-й группе.

Ошибка выборки при бесповоротном серийном (гнездовом) отборе с равновеликими сериями определяется по формуле

 

 

где r – количество серий, попавших в выборку;

R – количество серий в генеральной совокупности;

r – межгрупповая (межсерийная) дисперсия. Если серии (группы, гнезда) по количеству единиц одинаковы (равновелики), то они исчисляются по формуле

где – средняя в i-й серии;

– общая выборочная (или межсерийная) средняя;

r – количество серий, попавших в выборку.

При исчислении аналогичных показателей для доли используются эти же формулы, но с учетом, что дисперсия альтернативного признака в выборочной совокупности определяется по формуле , где w – доля признака в выборке.

Полученный по этим формулам результат корректируется с учетом величины доверительной вероятности, с которой надо гарантировать результаты выборочного наблюдения. Коэффициент доверия (t) определяется по специальным таблицам.

Следовательно, предельная ошибка выборки исчисляется по формуле

В экономико-статистических исследованиях широко применяются t = 1 (соответствует вероятность Р = 0,683), t = 2 (соответствует Р = 0,954), t = 2,6 (с вероятностью 0,99) и t = 3 (с вероятностью 0,997).

Показатель относительной ошибки выборки (β) определяется по формуле

 

 

При проведении выборочного наблюдения большое значение придается определению объема выборки, т.к. средняя ошибка выборки обратно пропорциональна .

Для определения численности собственно-случайной выборки используются формулы:

а) для повторной выборки

б) для бесповторной выборки:

 

При прочих равных условиях при бесповторном отборе требуется меньший объем выборочной совокупности, чем при повторном.

При изучении альтернативного признака (доли совокупности) необходимый объем выборки определяется по формулам:

а) при повторном отборе

 

 

б) при бесповторном отборе

 

 

Если n > 100 выборочная совокупность называется большой, а при n < 100 – малой. Однако на практике к малым выборкам обычно относят выборки объемом менее 30 единиц. Производственный или экономический эксперимент легче провести на небольшом числе испытаний.

С использование выборочных характеристик и предельной ошибки выборки можно установить границы нахождения соответствующих генеральных характеристик:

 

 

Задача № 1.Методом случайного отбора по жребию из 1200 рабочих предприятия были отобраны 80 человек. Изучение уровня их квалификации позволило составить следующую таблицу:

 

Разряд
Число отобранных рабочих

 

Оценить средний тарифный разряд рабочих данного предприятия и исчислить предельную ошибку с вероятностью доверия 0,95 (или t = 1,96).

 

Задача № 2.С целью определения среднего стажа работы рабочих предприятия (в годах) произведена 10%-ная, бесповторная выборка способом типического пропорционального отбора. Результаты обследования сведены в следующую таблицу:

 

Группы рабочих по полу Группа рабочих по стажу работы, лет Итого
До 2 2–5 5–10 10–20 20–25 25 и выше
Мужчины
Женщины

 

Определите с вероятностью 0,997: а) предельную ошибку выборки среднего стажа работы всех рабочих; б) пределы, в которых находится средний стаж работы; в) предельную ошибку доли рабочих со стажем до 5 лет;
г) пределы, в которых находится число рабочих со стажем до 5 лет.

 

Примечание: Для типической выборки средняя ошибка определяется по формуле

где - средняя из групповых дисперсий.

 

Задача № 3.По данным задачи 2 оценить долю рабочих, имеющих высшие 7 и 8-й разряды в целом по предприятию, и определить предельную ошибку с вероятностью 0,95.

 

Задача № 4. Из 1000 приборов произведена выборка 100 приборов, из которых 2 оказались не соответствующими требованиям ОТК. Оценить, можно ли пользоваться результатами выборочного обследования для характеристики качества работы предприятия при вероятности доверия 0,95.

 

Задача № 5.Определить, сколько рабочих должно быть обследовано, чтобы возможная ошибка среднего разряда, полученная по результатам выборочного обследования, исходные данные по которой приведены в задаче 2, уменьшилась в 2 раза при той же доверительной вероятности.

 

Задача № 6.Определить объем выборочной совокупности для получения приемлемых результатов оценки доли высококвалифицированных рабочих по исходным данным, приведенным в задаче 2.

Рекомендуется сохранить исходную доверительную вероятность и получить предельную ошибку выборки меньше 5%.

 

Задача № 7.Определить средний срок службы радиоламп по продолжительности их горения. Для проверки продолжительности горения радиоламп сделана выборка 10 радиоламп. Выборочная средняя составляет = 1506 ч, выборочная дисперсия = 324. Доверительную вероятность принять 0,966.

Примечание: Средняя ошибка малой выборки определяется по формуле

 

 

Задача № 8.Для выборочного контроля качества комплектующих полупроводниковых изделий из партии в 10000 шт. было отобрано 360 шт., из которых 36 оказалось второго сорта. Требуется определить, с какой вероятностью можно утверждать, что доля второго сорта во всей партии лежит между 5 и 15% (отбор бесповторный).

 

Задача № 9.Необходимо определить численность выборки, которая позволила бы оценить средний возраст работников, занятых в данной отрасли с точностью до 0,5 года при доверительной вероятности (степени надежности) р =0,9973. Общая среднегодовая численность работников по данной отрасли составляет 40000 чел.

Примечание: Величина дисперсии данного признака определяется на основе пробного обследования. Сообщает преподаватель.

 

Задача № 10.При контрольной проверке качества поставляемых предприятию комплектующих изделий проведено 10%-е выборочное обследование. Из партии, содержащей 100 коробок комплектующих изделий, методом механического отбора в выборку взяты 10 коробок. В результате сплошного обследования находящихся в каждой коробке упаковок получены следующие данные о распределении выборочной совокупности (см. таблицу).

 

Коробки 6-я 16-я 26-я 36-я 46-я 56-я 66-я 76-я 86-я 96-я
Кол-во упаковок, всего
Из них имеют стандартные характеристики

 

По данным выборочного обследования нужно установить с вероятностью 0,95 предел удельного веса стандартной продукции во всей партии.

Задача № 11. Производится выборочная 5%-ная разработка данных об успеваемости студентов вуза по результатам зимней экзаменационной сессии. Результаты разработки данных оказались следующими:

 

Баллы успеваемости
Количество студентов

 

Для случайного бесповоротного отбора с вероятностью 0,954 определите по вузу в целом: а) предельную ошибку выборки среднего выборочного балла успеваемости; б) пределы, в которых находится средний балл успеваемости в целом по вузу; в) целесообразно ли определять с указанной вероятностью предельную ошибку доли студентов, получивших неудовлетворительную оценку? Отличную оценку? Если нет, объясните почему.

 

Задача № 12. Где ошибка частости будет больше (при прочих равных условиях): а) при отборе 100 единиц или 100 гнезд; б) при отборе 200 единиц или 50 серий, если общая дисперсия в 3 раза больше межгрупповой; в) при отборе 400 единиц или 100 гнезд, если общая дисперсия равна 0,16, а эмпирическое корреляционное отношение – 0,25 при районировании и 0,5 при гнездовании?

 

Задача № 13. Определите: а) как изменится ошибка повторной выборки, если среднее квадратическое отклонение признака будет больше в 2 раза, на 10%; б) как изменится при тех же условиях объем выборки; в) как изменится объем выборки, если вероятность, гарантирующую репрезентативность, увеличить с 0,954 до 0,997.

 

Контрольные вопросы

 

1. Какие методы несплошного наблюдения Вам известны? Дайте краткую характеристику им.

2. Как формируется выборочная совокупность?

3. Какие способы отбора единиц генеральной совокупности в выборку Вам известны? Дайте краткую характеристику им.

4. От чего зависит репрезентативность выборки?

5. Как влияет объем выборки на ее ошибку?

6. Как определяется ошибка выборки в зависимости от способа отбора?

7. как определить «оптимальный» объем выборки?

8. Как распространяются выборочные характеристики на всю совокупность?

9. Какая связь существует между величиной ошибки выборки и вероятностью, с которой необходимо обосновать надежность характеристики генеральной совокупности?

10. Что такое малая выборка и какие особенности имеются при ее применении?