Методические рекомендации для выполнения задания

Практическое занятие 3

Тема занятия:Модели бинарного выбора: логит-модель, пробит-модель

Расчетные формулы

В моделях бинарного выбора зависимые переменные являются двоичными.

Модель для двоичной переменной имеет вид

- скрытая (латентная) переменная,

Представленная модель называется моделью вероятности. Часто на практике используется логитовая модель вида:

где называется логитом, а Pi определяется вероятностью зависимой переменной Yt, рассчитываемой на основе логистического распределения:

В пробитовой модели, по аналогии с логитовой моделью, ненаблюдаемая величина Pi рассчитывается исходя из дистрибуанты нормального распределения как:

Параметры b логитовой и пробитовой моделей связаны соотношением:

На практике может использоваться любой из этих методов, поскольку все меры соответствия моделей эмпирическим данным оказываются для них идентичными.

Логитовый анализ используется в экономических исследованиях применительно к срезам индивидуальных данных тогда, когда эндогенная переменная имеет двоичный характер. Чаще всего эта переменная представляет результаты принятия рациональных экономических решений, например, приобретения автомобиля или квартиры, предоставления банковского кредита, слияния или поглощения фирм.

Задание для выполнения в аудитории

Задание 3.1.Фирма «Бэст Перспектива» заключила договор с ОАО «Центртелеком», предметом которого является оказание услуг связи, в том числе и доступ в Интернет. С целью увеличения интеллектуального потенциала фирмы руководство решило расширить круг своих сотрудников, обладающих правом бесплатного доступа. Выбор таких сотрудников решено было осуществлять с учетом ряда факторов, тем или иным образом характеризующих претендентов с точки зрения эффективного использования Интернет-ресурсов. В связи с эти возник вопрос: Кому из претендентов на бесплатный доступ предоставить такую возможность в первую очередь? Для того, чтобы получить обоснованный ответ, руководство фирмы поручило экономико-аналитическому отделу разработать модель, позволяющую по каждому претенденту рассчитать прогнозную оценку целесообразности предоставления ему права бесплатного доступа к ресурсам Интернета. В основу построения такой модели была положена идея применения бинарной переменной Y: Y=1, если сотрудник, обладающий правом бесплатного доступа к Интернет-ресурсам, по оценке экспертной группы, эффективно пользуется эти правом; Y=0, в противном случае. Построение модели руководство фирмы предложило провести по пяти факторам: возраст (X1, лет), стаж профессиональной деятельности (X2, лет), заработная плата (X3, тыс. ден. ед.), число случаев поступления полезной для фирмы информации от сотрудника (X4, ед.), результат тестирования на предмет оценки навыков работы в Интернет (X5, в баллах). Значения этих показателей, а также значения бинарной переменной для 100 сотрудников фирмы представлены в таблице.

Таблица 3.1

Y X1 X2 X3 X4 X5 Y X1 X2 X3 X4 X5
2,5 10,2
6,7
2,1 9,9
4,6 13,1
5,9 9,1
3,3 9,7
3,2 6,8
12,2
2,7 3,9
3,8 12,5
4,2 2,8
6,7 3,4
6,5 4,9
3,4 6,7
7,2 6,6
7,9 8,9
6,4 5,5
6,3 5,7
6,1 6,1
9,7 7,3
6,4 9,2
10,5 7,9
12,3 2,5
10,1 6,8
7,9
9,7 5,4
8,9 7,6
3,4 5,5
3,7 5,4
2,9 2,8
3,8 6,5
4,3 6,9
6,9 3,2
6,5 6,1
9,2 5,9
10,3 7,8
10,8 7,3
9,4 6,4
9,8 6,5
7,9
3,4 7,8
4,3
4,9
3,2 5,4
12,4 2,9
3,1 6,4
12,7 5,7
3,5 3,6
9,9
11,8 6,1

Имеются следующие претенденты на право бесплатного доступа.

1) возраст – 27 лет, стаж – 3 года, заработная плата – 3200 руб., количество случаев нахождения полезной для фирмы информации – 9 раз, тест – 15 баллов;

2) возраст – 44 года, стаж – 12 лет, заработная плата – 5600 руб., количество случаев нахождения полезной для фирмы информации – 2 раза, тест – 5 баллов;

3) возраст – 35 лет, стаж – 10 лет, заработная плата – 4100 руб., количество случаев нахождения полезной для фирмы информации – 4 раза, тест – 7 баллов;

4) возраст – 39 лет, стаж – 13 лет, заработная плата – 7500 руб., количество случаев нахождения полезной для фирмы информации – 11 раз, тест – 15 баллов.

Используя построенную прогнозную модель, определить среди имеющихся претендентов тех, кому в первую очередь следует предоставить право бесплатного доступа к ресурсам Интернета.

Методические рекомендации для выполнения задания

1. Импорт данных из таблицы Excel: Файл/Открыть/Импорт/ Excel/Занятие_бинарные_модели.xls

2. Построение логитовой модели: Модель /Нелинейные модели/Логит/ Бинарный…

Рис. 3.1. Окно построения логитовой модели

В предпоследнем столбце окна результатов приведено отношение оценок к среднему значению, которое может интерпретироваться как направление изменения вероятностей для всех переменных. Параметры направления (z) свидетельствуют, что при увеличении стажа профессиональной деятельности (X2) и заработной платы (X3) – отрицательный знак параметра, вероятность принятия решения о целесообразности предоставления сотруднику права бесплатного доступа к ресурсам Интернета снижается. При увеличении таких факторов как возраст, результаты тестирования, количество случаев нахождения полезной информации – вероятность увеличивается. Тест Стьюдента свидетельствует, что факторы X2,X5 являются несущественными.

3. Выполним последовательное исключение несущественных переменных: В окне модели: Тесты/ Избыточные переменные /Последовательное исключение переменных

Рис. 3.2. Окно исключения несущественных переменных

Обратим внимание на изменение знаков коэффициентов на противоположные при записи модели:

О значимости совокупной регрессии свидетельствует Xи-квадрат (105,292) и его p-значение (0,0000<0,05).

Для оценки прогнозных возможностей построенной модели в качестве меры соответствия модели эмпирическим данным можно использовать коэффициент корреляции между переменной Yi и теоретическими значениями модели Pi.

4. Сохраним теоретические значения модели в базе данных: В окне модели: Сохранить / Расчетные значения / Название переменной YR.

5. Рассчитаем коэффициент корреляции между переменной Yi и теоретическими значениями модели Pi: Вид/Корреляционная матрица

Рис. 3.3. Окно корреляционной матрицы

Коэффициент корреляции составил 0,903, значит, подтверждено соответствие модели эмпирическим данным. Статистика Стьюдента (20,81) подтверждает статистическую значимость коэффициента корреляции. Чаще всего логитовые модели имеют низкий уровень объяснения изменчивости. В нашем случае, наоборот. R-квадрат Маккфадена и исправленный R-квадрат, коэффициент корреляции имеют высокие значения.

6. Сопоставим фактические значения бинарной переменной Y c расчетными значениями Pi. Сохраним остатки модели в базе данных: В окне модели: Сохранить / Остатки. Затем создадим матрицу YP: Добавить / Добавить матрицу:

и т.д.

Рис. 3.4. Окно добавления матрицы YR

Попарное сравнение фактических значений бинарной переменной Y c расчетными значениями Pi позволило сделать следующий вывод: В 94 случаях из 100 удалось точно предсказать стратегию поведения фирмы в отношении сотрудников (предоставлять или нет право бесплатного доступа к ресурсам Интернет).

7. Используем построенную логит-модель для выбора среди имеющихся претендентов тех, кому в первую очередь следует предоставить право бесплатного доступа к ресурсам Интернета.

1)

2)

3)

4)

Оценки коэффициентов модели и значения факторов Х1,Х2,Х3,Х4 для каждого из четырех претендентов введем в скаляры:

Рис. 3.5. Окно ввода скалярных величин

P1=1/(1+exp(-B0-B1*X11-B2*X21-B3*X31-B4*X41));

P2=1/(1+exp(-B0-B1*X12-B2*X22-B3*X32-B4*X42));

P3=1/(1+exp(-B0-B1*X13-B2*X23-B3*X33-B4*X43));

P4=1/(1+exp(-B0-B1*X14-B2*X24-B3*X34-B4*X44)).

Следовательно, первому и четвертому претендентам целесообразно предоставить право бесплатного доступа, а второму и третьему нет.

8. Построение пробитовой модели: Модель/Нелинейные модели /Пробит/ Бинарный…

Рис. 3.6. Окно построения пробит-модели

В предпоследнем столбце окна результатов приведено отношение оценок к среднему значению, которое может интерпретироваться как направление изменения вероятностей для всех переменных. Параметры направления (z) свидетельствуют, что при увеличении стажа профессиональной деятельности (X2) и заработной платы (X3) – отрицательный знак параметра, вероятность принятия решения о целесообразности предоставления сотруднику права бесплатного доступа к ресурсам Интернета снижается. При увеличении таких факторов как возраст, результаты тестирования, количество случаев нахождения полезной информации – вероятность увеличивается. Тест Стьюдента свидетельствует, что факторы X2,X5 являются несущественными.

9. Выполним последовательное исключение несущественных переменных: В окне модели: Тесты/ Избыточные переменные /Последовательное исключение переменных:

Рис. 3.7. Окно исключения несущественных переменных

Запишем модель:

О значимости совокупной регрессии свидетельствует Xи-квадрат (105,397) и его p-значение (0,0000<0,05).

10. Используем построенную модель для выбора среди имеющихся претендентов тех, кому в первую очередь следует предоставить право бесплатного доступа к ресурсам Интернета. Значения коэффициентов модели (A0,A1,A3,A4,A5), фактора X51, X52, X53, X54 введем в скаляры и выполним расчет:

1) F1=A0+A1*X11+A3*X31+A4*X41+A5*X51

2) F2=A0+A1*X12+A3*X32+A4*X42+A5*X52

3) F3=A0+A1*X13+A3*X33+A4*X43+A5*X53

4) F4=A0+A1*X14+A3*X34+A4*X44+A5*X54

Затем, Инструменты – Поиск p-значения:

Рис. 3.8. Окно функции стандартизованного нормального распределения

(0,423926)

Таким образом, право доступа к ресурсам Интернет можно предоставить первому и четвертому претендентам.

Таблица 3.2

Сводная таблица результатов моделирования