ример. Реклама в журналах.

Тарифы на размещение рекламных объявлений в журналах определяются каждым журналом самостоя­тельно. Чем объясняются различия в тарифах? Возможно, здесь каким-то образом учитывается ценность рекламного объявления для рекламодателя. Журналы, располагающие большей читательской аудитори­ей (при равных прочих условиях), наверное, вправе устанавливать большие тарифы. Кроме того, журна­лы, рассчитанные на более состоятельные круги читателей, также вправе устанавливать более высокие тарифы. Несмотря то что наверняка имеются и другие, не менее важные факторы, мы ограничимся лишь указанными двумя, добавив к ним еще один — предпочтения людей разного пола, и выясним, изменяют ли журналы свои тарифы в зависимости от соотношения мужчин и женщин в их читательской аудитории. Ответы на некоторые из этих вопросов можно получить с помощью множественного регрессионного ана­лиза. Такой анализ поможет нам объяснить влияние на тарифы таких факторов, как величина читатель­ской аудитории, структура читательской аудитории по полу и доходы читателей.

В табл. 3 представлена соответствующая многомерная совокупность данных, которую нам предстоит проанализировать. В качестве переменной У (объясняемой) мы будем рассматривать стоимость одной страницы одноразовой полноцветной рекламы. Объясняющими переменными будут Х1, читательская ау­дитория (планируемая в тысячах человек), Х2, процент мужчин среди планируемой аудитории, и Х3, ме­диана дохода семьи. Размер выборки n = 55.

В табл. 1 представлена компьютерная распечатка результатов анализа множественной регрессии. Например, с помощью Excel можно выполнить анализ множественной регрессии. Найдите пункт Data Analysis (Анализ данных) в меню Tools (Сервис) и выберите команду Regression (Регрессия). Если в меню Tools (Сервис) отсутствует пункт Data Analysis (Анализ данных), то сначала убеди­тесь, что вы выбрали ячейку электронной таблицы (а не график, например). Если вы все же не можете найти Data Analysis (Анализ данных), поищите пункт меню Add-Ins (Надстройки) и по­ставьте отметку возле Analysis ToolPak (Пакет анализа). Если это не поможет, то, видимо, необ­ходимо переустановить Excel.

 

Таблица 1. Результат множественной регрессионного анализа тарифов на размещение рекламы в журналах (вычисления сделаны в Excel)

ВЫВОД ИТОГОВ            
             
Регрессионная статистика          
Множествен. R 0,887          
R-квадрат 0,787          
Нормированный R-квадрат 0,775          
Стандартная ошибка 21577,870          
Наблюдения          
             
Дисперсионный анализ          
  df SS MS F Значимость F  
Регрессия 62,843 0,000000  
Остаток      
Итого        
             
  Коэффициенты Стандартная ошибка t-статистика P-значение Нижние 95% Верхние 95%
Y-пересечение 4042,799 16884,039 0,239 0,812 -29853,298 37938,895
Переменная X 1 3,788 0,281 13,484 0,000 3,224 4,352
Переменная X 2 -123,634 137,849 -0,897 0,374 -400,377 153,108
Переменная X 3 0,903 0,370 2,442 0,018 0,161 1,645
             

 

Коэффициенты регрессии и уравнение регрессии

Сдвиг, или постоянный член, а, и коэффициенты регрессии, b1, b2, и b3, вы­числяются компьютером с использованием метода наименьших квадратов.

Среди всех возможных вариантов уравнения регрессии с различными значениями этих коэффициентов именно уравнение, найденное таким методом, обеспечивает ми­нимальную сумму квадратов ошибок про­гнозирования для рассматриваемой нами выборки журналов. Уравнение регрессии (или уравнение прогнозирования) имеет следующий вид:

(прогнозируемый тариф на размещение рекламы) = а + b1X1 + b2X2 + b3X3 =

= $4043 + 3,79(читательская аудито­рия) – 124(процент мужчин) + 0,903(медиана дохода).

 

Сдвиг, а = $4 043, интерпретируется сле­дующим образом: типичный тариф на раз­мещение одностраничного цветного реклам­ного объявления в журнале, у которого нет платных подписчиков, нет мужчин среди чи­тателей и читатели не имеют дохода, состав­ляет $4043. Однако в рассматриваемой нами совокупности данных нет подобных журналов, поэтому сдвиг, а, следует рас­сматривать лишь как вспомогательную величину, необходимую для получения оп­тимальных прогнозов, но не интерпретировать это значение так буквально.

Коэффициенты регрессии интерпретируются как влияние каждой из пере­менных на размер тарифа, если все другие независимые («объясняющие») пере­менные остаются неизменными. Часто это значение включает «поправку на» другие независимые переменные, или «контролирование» этих других независи­мых переменных. Поэтому коэффициент регрессии для конкретной X-переменной может изменяться (иногда значительно) в результате включения в анализ или исключения других Х- переменных. В частности, каждый коэффициент регрессии определяет среднее увеличение тарифа на размещение рекламы, приходящееся на единичное увеличение соответствующей ему Х- переменной (в данном случае термин «единичное» означает одну единицу измерения конкрет­ной Х- переменной).

Коэффициент регрессии для размера читательской аудитории, b1=3,79, указы­вает, что – при всех прочих равных условиях – журнал с дополнительной тыся­чью читателей (поскольку у нас X1измеряется в тысячах человек) берет (в сред­нем) на $3,79 больше за размещение одностраничного цветного рекламного объяв­ления. Можно также считать, что коэффициент регрессии для размера читательской аудитории означает, что каждый дополнительный читатель увеличи­вает для этого журнала тариф на размещение рекламных объявлений на $0,00379, т.е. увеличение составляет чуть меньше половины цента на одного человека. По­этому, если у какого-то другого журнала такой же процент читателей-мужчин и такой же показатель медианы дохода семьи читателей, но читательская аудитория на 3548 человек больше, то можно ожидать, что тариф на размещение рекламных объявлений в этом журнале будет (в среднем) на 3,79 × 3,548 = $13,45 больше благодаря такому отличию размера читательской аудитории.

Коэффициент регрессии для процента мужчин, b2 = -124, указывает, что (при всех прочих равных условиях) тариф на размещение цветных рекламных объяв­лений в журнале с дополнительным 1% читателей-мужчин окажется (в среднем) на $124 меньше. Это означает, что читательницы представляют для журнала большую ценность, чем читатели-мужчины. Статистический вывод должен подтвердить или опровергнуть эту гипотезу путем сравнения величины влияния процента мужчин (т.е. -$124) с тем, на что можно было бы рассчитывать, если бы при данных обстоятельствах все определялось лишь чистой случайностью.

Коэффициент регрессии для медианы дохода, b3 = 0,903, указывает, что (при всех прочих равных условиях) в журнале с дополнительным долларом медианы дохода его читателей тариф на размещение одностраничного цветного рекламно­го объявления будет (в среднем) на $0,903 больше. Положительный знак этого коэффициента совершенно оправдан, поскольку люди с более высоким уровнем доходов могут позволить себе тратить больше на покупку рекламируемой про­дукции. Если у какого-то другого журнала такой же процент читателей-мужчин и такая же величина читательской аудитории, но медиана дохода семей читате­лей на $4 000 выше, то можно ожидать, что тариф этого журнала на размеще­ние рекламных объявлений будет на 0,903 × 4000 = $3612 выше (в среднем) благодаря более высокому уровню доходов его читателей.

Помните, что коэффициенты регрессии отражают влияние на Y одной X- переменной при условии, что все другие Х- переменные остаются неизменными. Это следует понимать буквально.

Например, коэффициент регрессии b3 отражает влияние медианы дохода читателей на рекламные тарифы; он вычисляется при неизменных величинах читательской аудитории и процента читателей-мужчин. В таком случае более высокие уровни доходов читателей, как правило, ведут к установлению более высоких тарифов на размещение рекламных объявлений (поскольку b3является положительным числом) – при фиксированных размере читательской аудитории и проценте читателей-мужчин.

Какой была бы эта взаимосвязь, если бы остальные переменные (размер чита­тельской аудитории и процент читателей-мужчин) не фиксировались на посто­янном уровне? На этот вопрос можно ответить, проанализировав обычный коэф­фициент корреляции (или коэффициент регрессии, прогнозирующий Y на осно­вании только одной этой Х- переменной), вычисленный только для двух переменных: тарифа и медианы дохода. В нашем случае более высокое значение медианы дохода фактически ассоциируется с более низким тарифом (корреляция тарифа и медианы дохода является отрицательной: -0,167)! Чем это объяснить? Вполне приемлемое объяснение заключается в том, что журналы, ориентирую­щиеся на читателей с более высоким средним уровнем доходов, не в состоянии обеспечить себе массовую аудиторию из-за того, что богатых людей среди насе­ления страны в целом не так уж много. Если же эта читательская аудитория бо­гатых людей окажется очень небольшой, это может вообще исказить эффект влияния высокого уровня доходов в расчете на одного читателя.

Прогнозы

Уравнение прогнозирования, или уравнение регрессии, определяется в сле­дующем виде:

прогнозируемое значе­ние Y = а + b1X1 + b2X2 + ... + bkXk ,

 

В нашем примере с рекламными объявлениями в журналах, чтобы найти прогнозируемую величину тарифа на размещение рекламных объявлений исходя из величины читательской аудитории, процента читателей-мужчин и медианы дохода читателей для конкретного журнала, подобного тем, которые составляют рассматриваемую нами выборку данных, подставим в уравнение прогнозирова­ния соответствующие этому журналу значения Х- переменных:

(прогнозируемый тариф на размещение рекламы) = а + b1X1 + b2X2 + b3X3 =

= $4043 + 3,79(читательская аудито­рия) – 124(процент мужчин) + 0,903(медиана дохода).

 

Допустим, например, что вы собираетесь основать новый журнал, «Популяр­ная статистика», который рассчитан на читательскую аудиторию порядка 900000 человек, 55% которых будут составлять женщины, а медиана дохода его читателей равна $50000. Данные в уравнение прогнозирования необходимо под­ставить в той же форме, что и в исходной совокупности данных (т.е. той, исходя из которой и строилось уравнение регрессии): X1 = 900 (читательская аудитория в тысячах человек), X2 = 45 (процент мужчин) и X3 = $50000 (медиана дохода). Прогнозируемое значение для этой ситуации определяется следующим образом:

 

прогнозируемый тариф на размещение рекламы в журнале «Популяр­ная статистика» =

= 4043 +3,79(читательская аудитория) –124(процент мужчин) +0,903(медиана дохода) =

= 4043 + 3,79 ´ 900 – 124 ´ 45 + 0,903 ´ 50000 = $47024.

 

Разумеется, рассчитывать на то, что тариф на размещение рекламы в журна­ле составит ровно $47024, не приходится. Во-первых, даже между журналами, данными о которых мы располагаем, наблюдаются случайные колебания, поэто­му прогнозы не являются идеальными даже для них. Во-вторых, прогнозы могут быть полезны лишь в той мере, в какой прогнозируемый журнал подобен жур­налам, принадлежащим к исходной совокупности данных. Если речь идет о но­вом журнале, то тариф на размещение рекламы в этом журнале может опреде­ляться не так, как для журналов с уже устоявшейся репутацией, которые мы использовали для построения уравнения регрессии.

С помощью этого уравнения можно также прогнозировать тарифы для жур­налов, принадлежащих к исходной совокупности данных. У первого журнала, «Audubon» X1 = 1645 (читательская аудитория равна примерно 1,6 миллиона че­ловек), X2 = 51,1 (т.е. 51,1% читателей этого журнала — мужчины) и X3 = 38787 (медиана годового дохода читателей этого журнала составляет $38787). Прогнозируемое значение для этого журнала можно найти по следую­щей формуле:

 

прогнозируемый тариф на размещение рекламы в журнале «Audubon» =

= 4043 +3,79(читательская аудитория) –124(процент мужчин) +0,903(медиана дохода) =

= 4043 + 3,79 ´ 1 645 – 124 ´ 51,1 + 0,903 ´ 38787 = $38966.

 

Остаток, или ошибка прогнозирования, определяется по формуле: Y–(прогнозируемое значение Y).

Для журнала, принадлежащего к исходной сово­купности данных, этот показатель равняется фактическому тарифу минус про­гнозируемый тариф. Для журнала «Audubon» фактический тариф составляет $25315, а прогнозируемый тариф – $38966. Таким образом, ошибка прогно­зирования равна 25315 – 38966 = –$13651. Отрицательный остаток указывает на то, что фактический тариф меньше прогнозируемого (в случае журнала Audu­bon примерно на $14000). Для многих из нас $14000 – огромные деньги; не­плохо бы взглянуть на другие ошибки прогнозирования, чтобы понять, в какой мере прогнозирование отражает реальную ситуацию. Почему рекламные тарифы в журнале Audubon оказались намного меньше их ожидаемой величины? Скорее всего, потому, что для прогнозирования использовалось лишь k = 3 из множест­ва возможных факторов, влияющих на величину рекламных тарифов (к тому же многие из этих факторов не очень понятны и их довольно сложно измерить).