Построение аналитической группировки

 

С целью изучения зависимости между среднегодовой стоимостью основных производственных фондов X и объемом произведенной продукции Y проведем процедуру аналитической группировки. Основанием группировки будет являться стоимость произведенной продукции.

Шаг 1. Определим количество групп, на которые необходимо разбить совокупность, для этого воспользуемся формулой Стерджесса:

(2.4)

где: N – число единиц изучаемой совокупности.

в нашем случае получаем:

Шаг 2.Найдем величину интервала используя формулу:

(2.5)

где: Xmax, Xmin – максимальное и минимальное значение единиц в изучаемой совокупности

Для получения максимального и минимального значение в пакете, выберем Statistics®Basic Statistics/Tables (Статистики®Основные статистики и таблицы). В появившемся окне Basic Statistics and Tables (Основные статистики и таблицы) необходимо выбрать пункт Descriptive statistics (Описательные статистики).

 

 

Рисунок 2.4 – Окно выбора основных статистик и таблиц

 

В окне Descriptive Statistics (Описательные статистики) укажем по каким переменным проводится расчет, для этого выберем кнопку Variables (Переменные) и выделим Y и X.

 

 

Рисунок 2.5 – Окно установок дескриптивных статистики

 

Нажав кнопку Summary (Вычислить) получим результаты, представленные в таблице 2.1.

 

Таблица 2.1 – Результаты расчета описательных статистик

 

  Valid N Mean Minimum Maximum Std.Dev.
Y 77,76 48,231
X 62,52 35,831

Шаг 3. Согласно полученным данным размах вариации будет равен h=(179-7)/6=28,6. Соответственно величины интервалов будет следующие: [7, 35,67); [35,67, 64,3); [64,3, 93,00); [93,00, 121,67); [121,67, 150,33); [150,33, 179,00].

Шаг 4. Прежде чем приступить непосредственно к построению группировки в пакете, образуем новую переменную (следующую после переменной X), для этого выберем Insert®Add Variables (Вставка ®Добавить переменную). Далее в окне Variable 3 (Переменная 3) заменим Var 3 на Y1, а в поле Long name (label or formula with Functions): (Длинное имя (вставка функции)) введем выражение =v1 (в результате выполнения данного действия будет выполнен перенос всех данных из первого столбца в текущий) (рисунок 2.6).

 

Рисунок 2.6 – Окно установок переменной

 

Прежде чем перейти к дальнейшему выполнению алгоритма построения аналитической группировки сделаем следующее замечание: так как переменные используемые исследователем могут быть обозначены как угодно, в данной программе все переменные, вводимые в поле Long name, обозначаются как v1, v2, v3, и т.д. Соответственно очень важно при образовании новой переменной или создании формул следить за правильностью ссылки на нужные переменные.

Шаг 5. Чтобы произвести группировку по переменной Y1 нужно ее выделить, щелкнув по заглавию, далее в главном меню выбрать Date®Recode (Данные®Перекоди­ровка). В появившемся окне Recode Values of Variable 3 (Перегруппировка значений переменной 3) укажем интервалы группировки, а в группе опций New Value (Новое значение) последовательно введем номера групп в которые попали предприятия - 1, 2, 3, 4, 5, 6 (рисунок 2.7).

То есть должны получить следующее:

1 – v3>=7 and v3<35,67;

2 – v3>=35,67 and v3<64,33;

3 – v3>=64,33 and v3<93,00;

4 – v3>=93,00 and v3<121,67;

5 – v3>=121,67 and v3<150,33;

6 – v3>=150,33 and v3<=179,00.

При вводе интервалов проследите чтобы все группы были заполнены, для этого используйте прокрутку окна.

 

 

Рисунок 2.7 – Запись границ интервалов

Шаг 6. Полученные данные необходимо упорядочить в порядке возрастания по переменной Y1.

Шаг 7. Для определения описательных статистик по группам предприятий вернемся в модуль Basic Stat/Tables (рисунок 2.4), в меню стартовой панели модуля выберите опцию Breakdown and one-way ANOVA (Разбиение и однофакторный дис­персионный анализ).

 

 

Рисунок 2.8 – Установки для проведения группировки

 

В качестве группирующей переменной (Grouping) выберем Y1, а в качестве зависимых переменных (Dependent): Y и X.

Шаг 8. В появившемся окне (рисунок 2.9) необходимо выбрать кнопку Summary: Table of statistics (Итоговая таблицы и статистики).

 

Рисунок 2.9 – Окно результатов классификации и дисперсионного анализа

 

В полученной таблице 2.2 содержатся все необходимые результа­ты по группам предприятий для переменных Y и X.

 

Таблица 2.2 – Результаты проведения аналитической группировки

 

Y1 Y Means Y N Y Std. Dev X Means X N X Std. Dev
1 21,8 11,5 22,2 10,7
2 48,5 7,1 43,8 6,3
3 74,8 8,6 60,3 13,2
4 111,3 6,7 79,0 8,3
5 150,0 0,0 128,0 0,0
6 166,7 12,0 127,7 19,0
All Grup 77,8 48,2 62,5 35,8

 

В столбце Means (Средние) содержатся значения средних арифметических по каждой группе, N – содержится количество индивидуальных значений вошедших в конкретную группу, Std. Dev. – стандартное отклонение.

Согласно приведенным в таблице 2.2, данным наблюдается рост групповых средних значений переменной Y, также наблюдается рост средних значений по переменной X, т.е. можно предположить наличие прямой корреляционной зависимости между рассматриваемыми признаками.