Семей, разделенных по группам и составам

 

Для исследования соотношения между потребительскими расходами и распределяемым доходом используются перекрестные данные о семейных бюджетах, относящиеся к некоторому фиксированному периоду времени. Прогноз строится с использованием обобщенного метода наименьших квадратов Гольдбергера[5]. Обозначим через Y величину потребительских расходов, а через X объем распределяемого дохода. Соберем данные о бюджете 10000 семей и образуем пары соответствующих измерений для величин Хi Yi(i = 1, 2,..., 10000). Предположим, что мы уже разделили семьи на группы по их размеру и составу и рассматриваем интересующую нас связь между Y и Xвнутри конкретной группы. Мы не ожидаем, что у всех семей этой группы, имеющих один и тот же доход X', будут одинаковые потребительские расходы Y'. Одни потратят больше других, а некоторые, наоборот, меньше, однако мы надеемся, что величины расходов сгруппируются вокруг некоторого значения, соответствующего тому объему дохода, о котором идет речь. Эта идея находит свое формальное воплощение в новой гипотезе о характере линейной зависимости:

(1)

Здесь символом U обозначена переменная, принимающая то положительные, то отрицательные значения. Таким образом, если мы рассмотрим подгруппу семей, располагающих доходом X', то центральным значением их потребительских расходов окажется величина а + bХ', в то время как реальные объемы потребления для семей данной подгруппы будут равны а + bХ' +U1, а + bХ'+ U2 и т.д., где U1, U2, ... измеряют отклонения потребительских расходов каждой отдельной семьи от центрального значения а + bХ'.

Существует три способа рационального объяснения включения в уравнение (1) стохастического члена, причем любое из этих объяснений не исключает других.

Во-первых, мы можем предположить, что потребительские расходы для всех и каждой из рассматриваемых семей были бы полностью объяснены, если бы мы знали все факторы, влияющие на эти расходы, и располагали необходимыми данными. Одинаковые по размеру и составу семьи могут отличаться возрастом родителей и детей, сложившейся динамикой дохода (возрастает он или убывает), бережливостью членов семьи и т.д. Многие из этих факторов не измеряются количественно, не квантуются и даже если такое измерение достижимо, то получение всех необходимых данных на практике оказывается невозможным.

Поскольку среди многочисленных факторов, влияющих на потребительский спрос конкретной семьи, многие действуют в противоположных направлениях, можно рассчитывать, что малые значения U, будут встречаться чаще, чем большие. Мы подошли, таким образом, к пониманию U как случайной переменной, обладающей вероятностным распределением с нулевым средним и с конечной дисперсией. Это позволяет нам обращаться с переменной U как со стохастическим возмущением (ошибкой). Ввиду того, что U включает много факторов, которые, по-видимому, можно считать независимыми, обращение к центральной предельной теореме показывает нам выбор для U нормального распределения.

Вторым оправданием присутствия в экономических соотношениях возмущающего члена служит то обстоятельство, что только с его помощью можно отразить вечный и непредсказуемый элемент случайности человеческих реакций, сплошь и рядом оказывающий воздействие на суммарный эффект существенных факторов и поэтому непосредственно влияющий на наблюдаемые значения переменной Y.

Третьим источником ошибок являются ошибки наблюдения или измерения.

Итак, пусть существует линейное соотношение между переменной Y, k-1,объясняющими переменными Х2, Х3 ..... Xk ивозмущением U. Если мы имеем выборку из п наблюдений над переменными Y и Xj, j = 2, 3, ..., k, то можно записать

Коэффициенты bи параметры распределения Uнеизвестны. Уравнения, соответствующие всем п наблюдениям, могут быть записаны компактно в матричной форме

(2)

где

Соглашение, в силу которого через Xki обозначается iнаблюдение переменной Xk, означает, что индексы в матрице X расположены в порядке, обратном общепринятому, когда первый индекс — номер строки, второй — номер столбца.

Примем простую гипотезу о нулевом значении математического ожидания стохастического возмущения U: E[U]= 0 и введем матрицу V:

где UTвектор-строка, полученная транспонированием вектора-столбца U.

По диагонали матрицы V расположены дисперсии элементов вектора U, остальные элементы — ковариации элементов вектора U:

Задача прогноза состоит в предсказании изолированного значения зависимой переменной для заданного вектора-строки Х0. Мы можем записать:

где U0 — истинное, но неизвестное значение возмущения в прогнозируемый момент. Пусть

где W— вектор размерности (n´1) прогнозируемого возмущения вектором выборочных возмущений. Сформулируем линейный прогноз:

Р = CTY, (7)

где С — вектор размерности (n´1), состоящий из п констант.

Чтобы значение Р было наилучшим прогнозом, необходимо выбрать вектор С, минимизирующий дисперсию прогноза:

Для определения ошибки прогноза вычтем из уравнения (7) уравнение (3); подставим в результат значение Y из (2) и, выполнив соответствующие преобразования, получим:

Из условия несмещенности прогноза следует, что вектор С должен удовлетворять равенству:

(9)

Тогда для ошибки прогноза имеем P – Y0 = CTU - U0, и, поскольку (Р – Y0) — скаляр, дисперсия прогноза равна

(10)

 

Чтобы минимизировать (10) при условии (9), образуем функцию

где L — вектор размерности (k´l), образованный множителями Лаг-ранжа. Затем продифференцируем Ф по векторам С и L и приравняем вектор частных производных к нулевому вектору.

Рассмотрим

Учитывая, что V— симметричная матрица, то есть для I ¹ j:

Возьмем частные производные по элементам вектора С:

За исключением множителя 2, правые части этих уравнений содержат элементы матричного произведения VС, которые образуют n-мерный вектор-столбец. Следовательно,

Аналогично получаем:

В результате дифференцирования имеем:

(11) (12)

Примем вектор частных производных равным нулевому вектору и получим систему:

которая может быть записана в виде

(13)

Из (13)получаем:

Применив правило отыскания матрицы, обратной к матрице, подвергшейся разбиению, имеем:

(14)

где Н = (-ХТ V-1Х)-1

Из (14)получаем:

(15)

где I - единичная матрица.

Следовательно, наилучшим нелинейным несмещенным прогнозом будет:

Учитывая, что e=(Y - XB) — вектор остатков, соответствующий методу наименьших квадратов,

Р = Х0В+ WTV-1e. (16)

Это и есть основной результат, полученный Гольдбергером для предсказания с помощью обобщенной модели наименьших квадратов.

Задача.Исследовать уровень ежемесячного среднедушевого потребления товаров первой необходимости и сделать прогноз этого уровня на будущее для семей со средним уровнем достатка.

Имеются данные среднемесячных затрат на питание по основным группам продуктов (распределяемый доход) и общих затрат на товары первой необходимости в выбранной группе семей в сопоставимых денежных единицах за 5 лет. Общая сумма затрат на товары первой необходимости включает, кроме затрат на указанные группы продуктов, затраты на фрукты, кондитерские изделия, а также непродовольственные товары повседневного спроса (мыло, газеты и т.п.).

Оценить необходимые затраты на эти товары при сохранении установившегося рациона питания, если цены на преобладающие продукты питания (колонки 2, 3, 4, 5) увеличатся в 1,5 раза по сравнению с последним годом.

Период времени (годы)     Затраты на мясные продукты (в мес.)   Затраты на молочные продукты (в мес.)   Затраты на оно щи (в мес.)     Затраты на мучные и крупяные изделия (в мес.) Общие затраты на товары первой необходимости (в мес.)  
9,5 3,7 4,5 6,5 5,5

Решение. В качестве математической модели зависимости общих затрат на товары первой необходимости от цен на основные продукты питания возьмем линейное соотношение (2). На основе данных задачи сформируем матрицы X, Y, Х0:

(17)

Х0 =(1 22,5 9 16,5 12).

Вычислим определитель квадратной матрицы X

detX= |X|= 2,9.

Так как detX ¹ 0, матрица X является невырожденной и, следовательно, для нее существует единственная обратная матрица Х-1и уравнение (15) может быть упрощено раскрытием скобок:

А это означает, что прогнозируемое значение среднемесячных затрат на основные продукты питания в следующем году может быть вычислено по формуле:

(18)

Для вычисления матрицы, обратной к X, воспользуемся известной теоремой. Совместное преобразование матриц Х и Е (единичной) будем осуществлять таким образом, чтобы врезультате каждого шага один из векторов матрицы X становился единичным.

Для преобразования k-говектора матрицы Х кединичному пересчет элементов матрицы X осуществляется по следующим формулам:

где i— номер строки;. J — номер столбца; верхним индексом * отмечены пересчитанные изданном шаге значения.

Элементы xkk каждого последующего шага выделены жирным шрифтом.

 

 

9,5 3,7 6,5
4,5 5,5
0,5 0,7 0,5 -1
1,5 3,5 -1
- 1
- 1
-9,6 -3 -16 -18
1,4 -2
0,1 1,5 -2
-2,2 -2 -6
-5,4 -1 -6 -12
-16,2 -22 -36
3,6 -7 -1
4,5 5,5 -9 -2
-2,2 -2 -6
-7,6 -8 -18
4,7 -10 13,5 0,25 -2,75
-0,2 -1 -0,5 0,5
- 0,725 -2,375 -1,3125 0,6875
-0,3 -1,5 0,75 -0,25
0,95 -2 2,25 -0,125 -0,125

 

Во избежание накопления ошибок округления последний шаг выполним в простых дробях. Тогда левая матрица станет единичной, правая после вынесения за знак матрицы общего для всех элементов множителя элемента примет вид:

(19)

В соответствии со значениями переменных (17) и (19),

Р = X0X-1Y= 157,0775862 = 157.

Ответ:Прогнозируемые затраты на продукты первой необходимости составят 157 денежных единиц.