Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:

§ Полигона

§ Гистограммы

§ Кумуляты

§ Огивы

№19

Многомерные группировки и их виды: на основе многомерной средней, кластерного анализа, методов дендритов и шаров. Важнейшие группировки и классификации, применяемые в практике статистики.

Сущность способа многомерной группировки заключается в том, что объекты классифицируют одновременно по всему набору признаков. Этот фиксированный набор признаков образует так называемое признаковое пространство, в котором каждому из них придается смысл координаты. Если в набор входит р признаков, то любой объект рассматривается как точка в р-мерном признаковом пространстве и задача рационального группирования сводится к выделению сгущений точек в этом пространстве. В этом случае группы формируются на основании близости объектов по большому числу признаков. При этом ни один из признаков, входящих в набор, не является необходимым или достаточным условием принаделжности конкретного объекта к группе.

Достоинство способа многомерной группировки заключается в том, что он позволяет с той или иной степенью точности формализовать задачу классификации, используя при этом различные алгоритмы таксономии, и выделить реально существующие в признаковом пространстве скопления точек - объектов с одновременной их группировкой по большому числу признаков.

Недостатком способа многомерной группировки является то, что он может быть применен только для классификации объектов, характеризуемых большим набором количественных признаков.

Избежать этого недостатка позволяют методы многомерных группировок.

Для ее решения целесообразно использовать методы многомерной группировки в однородности.

Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.

Большинство исследователей склоняются к тому, что впервые термин «кластерный анализ» (англ. cluster — гроздь, сгусток, пучок) был предложен математиком Р. Трионом. Впоследствии возник ряд терминов, которые в настоящее время принято считать синонимами термина «кластерный анализ»: автоматическая классификация, ботриология.

Спектр применений кластерного анализа очень широк: его используют в археологии, медицине, психологии, химии, биологии,государственном управлении, филологии, антропологии, маркетинге, социологии и других дисциплинах. Однако универсальность применения привела к появлению большого количества несовместимых терминов, методов и подходов, затрудняющих однозначное использование и непротиворечивую интерпретацию кластерного анализа.

Кластерный анализ выполняет следующие основные задачи:

Разработка типологии или классификации.

Исследование полезных концептуальных схем группирования объектов.

Порождение гипотез на основе исследования данных.

Проверка гипотез или исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных.

Независимо от предмета изучения применение кластерного анализа предполагает следующие этапы:

Отбор выборки для кластеризации. Подразумевается, что имеет смысл кластеризовать только количественные данные.

Определение множества переменных, по которым будут оцениваться объекты в выборке, то есть признакового пространства.

Вычисление значений той или иной меры сходства (или различия) между объектами.

Применение метода кластерного анализа для создания групп сходных объектов.

Проверка достоверности результатов кластерного решения.

Можно встретить описание двух фундаментальных требований предъявляемых к данным — однородность и полнота. Однородность требует, чтобы все кластеризуемые сущности были одной природы, описываться сходным набором характеристик. Если кластерному анализу предшествует факторный анализ, товыборка не нуждается в «ремонте» — изложенные требования выполняются автоматически самой процедурой факторного моделирования (есть ещё одно достоинство — z-стандартизация без негативных последствий для выборки; если её проводить непосредственно для кластерного анализа, она может повлечь за собой уменьшение чёткости разделения групп). В противном случае выборку нужно корректировать.

Формальная постановка задачи кластеризации

Пусть — множество объектов, — множество номеров (имён, меток) кластеров. Задана функция расстояния между объектами . Имеется конечная обучающая выборка объектов . Требуется разбить выборку на непересекающиеся подмножества, называемые кластерами, так, чтобы каждый кластер состоял из объектов, близких по метрике , а объекты разных кластеров существенно отличались. При этом каждому объекту приписывается номер кластера .

Алгоритм кластеризации — это функция , которая любому объекту ставит в соответствие номер кластера . Множество в некоторых случаях известно заранее, однако чаще ставится задача определить оптимальное число кластеров, с точки зрения того или иного критерия качества кластеризации.

Кластеризация (обучение без учителя) отличается от классификации (обучения с учителем) тем, что метки исходных объектов изначально не заданы, и даже может быть неизвестно само множество .

Решение задачи кластеризации принципиально неоднозначно, и тому есть несколько причин (как считает ряд авторов):

не существует однозначно наилучшего критерия качества кластеризации. Известен целый ряд эвристических критериев, а также ряд алгоритмов, не имеющих чётко выраженного критерия, но осуществляющих достаточно разумную кластеризацию «по построению». Все они могут давать разные результаты. Следовательно, для определения качества кластеризации требуется эксперт предметной области, который бы мог оценить осмысленность выделения кластеров.

число кластеров, как правило, неизвестно заранее и устанавливается в соответствии с некоторым субъективным критерием. Это справедливо только для методов дискриминации, так как в методах кластеризации выделение кластеров идёт за счёт формализованного подхода на основе мер близости.

результат кластеризации существенно зависит от метрики, выбор которой, как правило, также субъективен и определяется экспертом. Но стоит отметить, что есть ряд рекомендаций к выбору мер близости для различных задач.

№22

 

Статистическое изучение массовых социально-экономических явлений начинается прежде всего с их характеристики с помощью абсолютных величин. Абсолютными величинами называются показатели, выражающие абсолютные размеры конкретных явлений в единицах меры длины, массы, площади, объема, стоимости; отражающие их временные характеристики и объем совокупности (число единиц). Эти величины – всегда именованные числа. Так, численность работников измеряется количеством человек, протяженность кабеля – количеством километров, междугородный телефонный трафик – продолжительностью телефонных соединений и т.д. Во всех этих случаях указаны единицы измерения.

Все сведения, собранные в процессе статистического наблюдения, выражаются абсолютными величинами. Абсолютные статистические величины делятся на индивидуальные и сводные.

Индивидуальные абсолютные показатели выражают размеры количественных признаков у отдельных единиц изучаемых объектов. Эти показатели получают непосредственно в процессе статистического наблюдения: первичного учета, в переписных листах и других бланках обследования. На основе индивидуальных абсолютных величин группируются первичные материалы статистического наблюдения и строятся вариационные ряды.

Сводные (общие) абсолютные показатели получаются в результате суммирования значений индивидуальных абсолютных величин. Они характеризуют объем совокупности или объем признака всего явления или отдельных его частей. Сводные объемные показатели являются результатом сводки и группировки первичных статистических данных. Так, в результате сводки данных о работе филиалов организации связи становятся известны данные о количестве средств и пунктов связи, доходах и объеме услуг, о численности работников, заработной плате и т.д. в каждом филиале и в целом по организации. Все эти данные необходимы для контроля за выполнением бизнес-плана и характеристики результатов деятельности.

Если индивидуальные показатели характеризуют отдельный объект или единицу совокупности (доход работника, цена акции, средняя численность работников организации и т.д.), то сводные показателидают характеристику группе единиц, представляющую собой часть или совокупность в целом. Последние делятся на объемные, получаемые путем сложения значений признака отдельных единиц совокупности, ирасчетные показатели, вычисляемые по различным формулам для аналитических целей оценки вариации, взаимосвязи, структурных сдвигов. Объемный показатель (объем признака) может выступать в качестве абсолютного показателя (стоимость имущества отрасли, организации), сравниваться с другой объемной абсолютной величиной (численностью работников) или объемом совокупности (число организаций), что позволяет получать объемный относительный или средний показатель (фондовооруженность, средняя стоимость имущества). Расчетные показатели могут быть абсолютными, относительными, средними величинами, к ним относятся индексы, темпы роста и прироста, коэффициенты тесноты связи, ошибки выборки и т.д.

Применяемые в статистике абсолютные показатели измеряются в натуральных, условно-натуральных и стоимостных единицах. Натуральные показатели служат для характеристики объема производства отдельных видов услуг и предоставления в аренду определенных средств связи, структуры доходов по видам услуг, развития сети связи.

Условно-натуральные показатели находят применение в организациях связи, предоставляющих разнородные услуги одной подотрасли. Например, результаты труда оператора почтовой связи, принимающего и выдающего клиентам письма и бандероли: заказные и с объявленной ценностью, можно выразить с помощью коэффициентов приведения в одних единицах – письмах.

Стоимостные показатели дают денежную оценку социально-экономическим явлениям и процессам и служат для анализа сводных отъемных и расчетных показателей. Объективность анализа таких показателей обеспечивается их сопоставимостью по ценовым параметрам с учетом инфляции.

Для оценки общих затрат труда на предприятии, трудоемкости отдельных операций технологического процесса передачи информации применяют трудовые единицыизмерения в чел.-часах и чел.-днях.

Абсолютная величина, взятая сама по себе, не всегда позволяет сделать правильную оценку явления и только в сравнении с другой величиной проявляет свою истинную значимость. Например, если известно, что в городе имеется 50 тыс. телефонных аппаратов, то ничего еще нельзя сказать об обеспеченности телефонной связью жителей города. Только сопоставив эту величину с численностью населения, можно судить о доступности и насыщенности средствами местной телефонной связи.

Для обобщающей характеристики массовых социально-экономических явлений наряду с абсолютными величинами применяются относительные показатели. Относительными величинами характеризуют основные свойства и особенности общественных явлений. Приведенные в статистической таблице наряду с абсолютными величинами, они облегчают чтение и анализ статистических данных, позволяют более ясно представить изучаемое явление.

 

№23

Исследуя экономические явления или процессы, статистика не ограничивается расчетом только абсолютных показателей, которую большую роль они не играли в анализе Ведь ни одно явление не может быть понятным, я если его рассматривать вне связи с другими явлениями С этой целью абсолютным показателям дают сравнительную оценку с помощью относительных показателей есть последние являются результатом сопоставления абсолютных по показателей Значения относительных показателей для анализа достаточно большое, ведь с их помощью сравнивают характеристики отдельных единиц групп и совокупностей в целом, изучают структуру явлений и закономерности их развития, анализируют выполнение плана, измеряют темпы развития и интенсивность распространения общественных Объявленияявищ.

По форме относительный показатель представляет собой дробь, числителем которого является величина, которую сравнивают (в отдельных случаях ее называют текущей или отчетной), а знаменателем - величина, с которой осуществляют срав уравнение Знаменатель относительной величины считается базой сравнения Так, удельный вес высококвалифицированных работников предприятия рассчитывают делением количества лиц с высоким уровнем квалификации на общую численность работающих Базой сравнения в приведенном Примером аду есть общая численность работаях.

Если базовую величину показателя принимают за единицу, формой ее изображение коэффициент (кратное отношение), если за 100 - формой изображения относительных показателей будут проценты

Коэффициент как форма выражения относительной величины показывает, во сколько раз сравнительная величина больше базовой (или какую часть от нее составляет, если величина коэффициента меньше единицы)

В статистической практике коэффициенты, как правило, используют для выражения относительных величин в случаях, когда сравнительная величина превышает базовую более чем в 2-3 раза Если такое соотношение ю ае меньшие размеры - применяют процентные числа В случаях, когда базовую величину принимают за 1000, относительные показатели выражают в промилле ((%0) Например, если удельный вес лиц сельского населения района с высшим образованием составляет 16%0, это означает, что на каждую 1000 сельского населения в среднем приходится 16 человек с высшим образованием

В отдельных случаях относительные показатели рассчитывают на 10000 (продецимиле), 100000, 1000000 единиц (например, в статистике здравоохранения рассчитывают количество койко-мест на 10000 населения)

Относительные величины, выраженные на 1000, 10000, 100000 и т д единиц, принимаемых с целью предоставления им более подходящего для восприятия вид, поскольку, подобрав удачно базу сравнения, можно предотвратить дробь овыми числаам.

Форму выражения относительного показателя выбирают в каждом конкретном случае в зависимости от характера единиц наблюдения и результатов, которые получают при сопоставлении одной величины с другой

зависимости от познавательного значения относительные показатели, используемые статистика, классифицируют по следующим признакам:

1) отношение между одноименными показателями;

2) отношение между разноименными показателями

Первая группа представляет собой относительные величины, которые не имеют размерности, их выражающие, как правило, в процентах или в коэффициентах Показатели этой группы разнообразны, по назначению их разделяют на следующие виды: 1) относительные величины структуры, 2) относительные величины выполнения плана; 3) относительные величины выполнения планового задания; 4) относительные величины динамики, 5) Относительная величина сравненияя.

Вторая группа относительных показателей включает: 1) относительные величины интенсивности 2) относительные величины координации

Относительные показатели структуры характеризуют состав того или иного общественного явления, т.е. показывают, которую удельный вес занимают отдельные части во всем явлении Рассчитывают их отношением части к целому Выражаются они в процента ах или долях единицы Например, общие затраты на производство продукции составляют 600 грн, а расходы на оплату 240 грн Итак, удельный вес расходов на оплату труда в общей сумме расходов составляет 2 40:600 = 0,4, или 4040 %.

Относительные показатели выполнения плана - это отношение фактического уровня показателя до уровня, запланированного на тот же период Например, если было запланировано получить урожайность зерновых культур 46 ц / га, а фактически получено 49,8 ц с единицы и площади, то относительная величина выполнения плана составляет (49,8: 46) o 100 = 107,8%, т.е. план выполнен на 107,8%, или перевыполнение составляет 7,8%.

Относительные показатели выполнения планового задания представляют собой отношение величины показателя, установленного на плановый период, его величины, которая достигнута фактически в этот период, или любой другой, принятой за базу сравнения есть, это отно глашение планового уровня в следующем периоде до фактического уровня отчетного периода, принятого за базу сравнения Так, устанавливается задание: повысить производительность труда относительно предыдущего периода н а 16% или снизить себестоимость на 10 %.

Кстати, если подойти критически к этому вопросу, то относительные величины данного вида не являются показателями статистики А рассматривают их в статистике относительно действительного их связи статистическим относительными величин нами, в частности с показателями выполнения плану.

Относительные показатели динамики характеризуют изменения общественных явлений и процессов во времени Рассчитывают их отношением уровня соответствующего следующего периода к уровню предыдущего периода, или любого другого, принятого за базу ср уравнения соответствии с выбранной базы сравнения могут быть цепные и базисныеі. Цепные относительные величины динамики определяют отношением уровней следующего и предыдущего периодов Базисные относительные величины динамики рассчитывают отношением уровня соответствующего следующего периода до определенного уровня, принятого за базу сравнениюя.

Относительные показатели сравнения - это результат сопоставления одних и тех же характеристик двух различных совокупностей, групп или единиц Сравнивают при этом какие-либо количественные характеристики: объемы совокупностей (или групп), средние или сумма арные величины того или иного признака Например, сравнивая количество автомобилей по состоянию на начало года по двум предприятиям, получим относительную величинну

. . 66 = 0,75 '

сравнения, равной 88 (или 75%), т.е. в сравнительном предприятии численность автомобилей на 25% меньше, чем в базовом предприятии

Относительные показатели координации характеризуют соотношение между составными частями целого Одну из частей целого принимают за базу сравнения и находят отношение к ней всех остальных частей Например, по результатам переписи насе елення устанавливают соотношение рождений мальчиков и девочек (в расчете на 100 родившихся определенного пола) Или другой пример По результатам наблюдения установлено, что в предприятиях района с расчете на 100 мужчин работают 116 женщин Отдельные авторы склонны считать относительные величины координации относительными показателями структуры, что не совсем верно Ведь они не дают представления о структуре явлений, а лишь определяют, сколько единиц определенной части целого приходится на другую ее часть, принятым за базу сравнениявняння.

Отношения между разноименными (разнокачественных) показателями называютотносительными показателями интенсивности или

статистическими коэффициентами Они отражают степень распространения одного явления по сравнению с другими взаимосвязанными явлениями К ним относятся показатели плотности поголовья животных в расчете на 100 га си ильськогосподарських угодий (пашни, площади зерновых) Относительные показатели этой группы выражают всегда именуемыми числами При этом в их название входят наименование единиц измерения обоих сравниваемых озназнак.

Следует отметить, что относительные показатели могут быть средними величинами (например, средний темп роста, средний темп прироста, средний процент выполнения плана и т.п.), их рассчитывают двумя спосо Обамы: 1) как средние по отдельным относительных показателей, 2) как отношение двух суммарных абсолютных показателей, включающих абсолютные величины, положенные в основу расчета отдельных относительных величин розгами ляне пример вычисления среднего темпа роста работников предприятия по исходным данным таблицы9.

Таблица 9

Численность Показатели рабочих Вместе предприятия, чел В том числе
Цех № 1 Цех № 2 Цех № 3
Среднегодовая численность:        
базисный год
текущий год
Темп роста,% 108,3 131,0 113,8 73,4

Как видим, по расчетам соотношений абсолютных показателей относительный показатель динамики общей численности рабочих равен 108,3% (3900: 3600) 400 Относительные показатели динамики численности за а номерами цехов составляют соответственно: по цеху № 1 - 131,0%, цеха № 2 - 113,8, цеха № 3 - 73,4% Относительный показатель динамики общей численности рабочих можно рассчитать и как средний из отно них показателей динамики за соответствующими номерами цехов, а именно: (1,310 x1609 1,138 x816 0,734 x1175): 3600 = 3898,8:3600 = 1,083, или 108,3 %.

Приведенные расчеты позволяют сделать вывод, что средние относительные показатели являются общими относительными показателями, ведь они характеризуют общее изменение по всей совокупности, общее отношение одной совокупности к другой Отсюда можно сделать вывод, что как абсолютные, так и относительные показатели могут быть средними И те, и другие обладают рядом важных общих свойств, в связи с чем в статистике с абсолютными и относительными показателями отделяются как особый вид средние показатели Последние рассмотрены в разделілі.

Таким образом, из приведенного следует, что сопоставление статистических показателей осуществляется в различных формах и направлениях Согласно разных задач и направлений сопоставления статистических показателей применяется ують разные виды относительных величин Рассмотрены виды относительных величин сводятся к классификации, схематично представленной на рисунке 2.

Приведенная классификация наглядно иллюстрирует возможности сопоставления статистических данных, относящихся к различным периодам, различных объектов и различных территорий

№24

Средней величиной называется статистический показатель, который дает обобщенную характеристику варьирующего признака однородных единиц совокупности.

Величина средней дает обобщающую количественную характеристику всей совокупности и характеризует ее в отношении данного признака.

Так, например, средняя заработная плата дает обобщающую количественную характеристику состояния оплаты труда рассматриваемой совокупности работников. Кроме того, используя средние величины, имеется возможность сопоставлять различные информационные совокупности. Так, например, можно сравнивать различные организации по уровню производительности труда, а также по уровню фондоотдачи, материалоотдачи и по другим показателям.

Сущность средней заключается в том, что в ней взаимопогашаются случайные отклонения значений признака и учитываются изменения вызванные основным фактором.

Статистическая обработка методом средних величин заключается в замене индивидуальных значений варьирующего признака некоторой уравновешенной средней величиной .

Например, индивидуальная выработка у 5 операционистов коммерческого банка за день составила 136, 140, 154 и 162 операции. Чтобы получить среднее число операций за день, выполненных одним операционистом, необходимо сложить эти индивидуальные показатели и полученную сумму разделить на количество операционистов:

операций.

Как видно из приведенного примера, среднее число операций не совпадает ни с одним из индивидуальных, так как ни один операционист не сделал 150 операций. Но если мы представим себе, что каждый операционист сделал по 150 операций, то их общая сумма не изменится, а будет также равна 750. Таким образом, мы пришли к основному свойству средних величин: сумма индивидуальных значений признака равна сумме средних величин.

Это свойство еще раз подчеркивает, что средняя величина является обобщающей характеристикой всей статистической совокупности.

Средние величины широко применяются в различных отраслях знаний. Особо важную роль они играют в экономике и статистике: при анализе, планировании, прогнозировании, при расчете нормативов и при оценке достигнутого уровня. Средняя всегда именованная величина и имеет ту же размерность, что и отдельная единица совокупности.

Важнейшими условиями (принципами) для правильного вычисления и использования средних величин является следующие:

1. В каждом конкретном случае необходимо исходить из качественного содержания осредняемого признака, учитывать взаимосвязь изучаемых признаков и имеющиеся для расчета данные.

2. Индивидуальные значения, из которых вычисляются средние, должны относиться к однородной совокупности, а число их должно быть значительным.

Виды средних величин

Средние величины делятся на два больших класса: степенные средние и структурные средние

Степенные средние:

§ Арифметическая

§ Гармоническая

§ Геометрическая

§ Квадратическая

Структурные средние:

§ Мода

§ Медиана

Выбор формы средней величины зависит от исходной базы расчета средней и от имеющейся экономической информации для ее расчета.

Исходной базой расчета и ориентиром правильности выбора формы средней величины являются экономические соотношения, выражающие смысл средних величин и взаимосвязь между показателями.

Расчет некоторых средних величин:

§ Средняя заработная плата 1 работника = Фонд заработной платы / Число работников

§ Средняя цена 1 продукции = Стоимость производства / Количество единиц продукции

§ Средняя себестоимость 1 изделия = Стоимость производства / Количество единиц продукции

§ Средняя урожайность = Валовый сбор / посевная площадь

§ Средняя производительность труда = объем продукции, работ, услуг / Отработанное время

§ Средняя трудоемкость = отработанное время / объем продукции, работ, услуг

§ Средняя фондоемкость = Средняя стоимость основных фондов / объем продукции, работ и услуг

§ Средняя фондоотдача = объем продукции, работ и услуг / средняя стоимость основных фондов

§ Средняя фондовооруженность = средняя величина основных производственных фондов / среднесписочная численность производственного персонала

§ Средний процент брака = ( стоимость бракованной продукции / Стоимость всей произведенной продукции ) * 100%

 

 



>45