Формирование признакового пространства исследования социально-экономических систем
Постановка проблемы. Задачи управления социально-экономическими объектами и процессами, рассматриваемые в рамках менеджмента, носят, как правило, "гуманитарный" характер. Вот типичные примеры.
1. Решается проблема реструктуризации предприятия. На основании проведенного СТЭП-анализа руководством предприятия, приглашенными экспертами обсуждаются параметры проводимых изменений: степень вовлеченности коллектива в процесс реструктуризации, скорость проведения преобразований, меры по компенсации сопротивления изменениям (образование и участие, помощь и поддержка, переговоры и манипуляции, явное и скрытое принуждение). Сама технология изменений проводится в три этапа: "размораживание" преобразуемой ситуации, собственно проведение изменений, "замораживание" достигнутой ситуации.
2. Осуществляется управление развитием предпринимательства в регионе. С этой целью проводится мониторинг состояния экономики и предпринимательства. На основании SWOT-анализа, выявляющего сильные и слабые стороны процесса, возможности и угрозы, разрабатываются меры по облегчению предпринимательской деятельности (снижение налогового бремени, создание инвестиционных фондов, упрощение процедур открытия малого бизнеса и систем отчетности и т.д.), проводится обучение основам бизнеса и предпринимательства.
3. Принимается на работу на фирму новый сотрудник. С ним проводят собеседование, выявляют соответствие имеющихся у него компетенций (личностных, профессиональных) с требуемыми компетенциями (портретом специальности) по существующему регламенту работ, на выполнение которых принимается сотрудник.
Аналитические методы исследования в этих и аналогичных задачах имеют, к сожалению, в настоящее время в менеджменте второстепенное значение. Причины такого положения две:
• методы моделирования и оптимального принятия решений рассматриваются в иных дисциплинах: эконометрика, теория оптимального принятия решений, управленческие решения. Специалисты в области математического моделирования и принятия решений разобщены с практиками-управленцами;
• математические методы требуют выполнения жестких условий, которые, как правило, на практике нс выполняются и практикующим исследователям неизвестны. Вот характерный пример.
Пример 6.6. Строится регрессионная зависимость прибыли, получаемой предприятием, от следующих факторов: объем выпускаемой продукции, назначаемая цена, качество продукции, набор потребительских свойств, реализуемых продуктом, и пр. Искомая зависимость позволила бы решить ряд практически важных задач: прогноз поступлений прибыли в зависимости от вариаций того или иного фактора, оптимизация процесса производства.
Применение классических методов моделирования, основанных на методе наименьших квадратов, имеет ряд жестких ограничений. Вот некоторые из них:
• входные факторы заданы без ошибок и некоррелированны между собой;
• выходная величина задана с аддитивной ошибкой, распределенной по нормальному закону с нулевым математическим ожиданием и постоянной дисперсией;
• вид искомой зависимости известен.
Эти ограничения на практике или не выполняются в полном объеме, или являются трудно проверяемыми, что ограничивает область адекватного применения аналитических подходов. Применение математических методов без учета высказанного обстоятельства ведет в лучшем случае к ошибкам в моделировании (дезинформации участников процесса), в худшем – к отрицательным социально-экономическим последствиям. Вновь обратимся к примеру.
Пример. 6.7. "Для определения прогнозных показателей производства мяса и мясных продуктов (в пересчете на мясо) мясоперерабатывающей промышленностью Ростовской области с помощью корреляционно-регрессионного моделирования в качестве результативного показателя Y был взят объем производства мясной продукции (в пересчете на мясо, тыс. т) тремя предприятиями-представителями, а в качестве факторов были взяты следующие переменные: x1 – стоимость основных производственных фондов предприятий-представителей, млн руб. в сопоставимых ценах на одного среднегодового работающего; х2 – объем инвестиций, млн руб.; х3 – производительность труда, млн руб.; х4 – фондовооруженность, предприятий-представителей, млн руб.; х5 – балльная оценка маркетинговой деятельности по рекламе продукции, баллы; х6 – количество видов выпускаемой продукции, единиц; х7 – стоимость произведенной продукции в расчете на 1 т закупленного сырья, млн руб. в действующих ценах.
После решения математической задачи в регрессионную модель (6.8) вошло три фактора (х1, х2, х5), а уравнение регрессии приняло следующий вид:
Y = –6,737 + 0,153х1 + 0,308х2 + 1,322х5 . (6.8)
Коэффициент множественной регрессии R = 0,964 свидетельствует о достаточно высоком уровне связи, коэффициент детерминации R2 = 0,93 показывает, что свыше 93% изменений объемов валовой мясной продукции (в пересчете на мясо) зависит от включенных в модель факторов. T-коэффициенты (критерий Стьюдента) достаточно высоки (2,4–3,2).
Таким образом, прогноз, разработанный с использование корреляционно-регрессионного моделирования, показал, что объем выработки мясной продукции (в пересчете на мясо) в 2012 г. может вырасти на 82,8% в сравнении с 2006 г., в 2015 г. – на 101,9% соответственно".
Проанализируем результаты решения поставленной задачи. Согласно полученной модели объем производства мясной продукции Y не зависит от производительности труда х3. То есть о ней можно на производстве не беспокоиться. Зафиксировав на некотором уровне переменные х1 – стоимость основных производственных фондов предприятий-представителей и х5 – балльную оценку маркетинговой деятельности по рекламе продукции, получим линейную функцию К(х2). Значит, управляя только объемом инвестиций (при прочих равных условиях), можно довести выпуск мясной продукции в области до любого (даже абсурдного) значения. Более того, аналогично можно вообще поставить выпуск мясной продукции в зависимость от рекламной деятельности. Очевидно, что это не так. Но почему вычислительная процедура, исполненная на многократно апробированном программном продукте, выдает более чем удовлетворительные показатели надежности модели R и R2?
В примере 6.7 для решения задачи применяют стандартный пакет построения регрессионной зависимости, не беспокоясь о том, выполняются ли следующие требования его применения:
• вид зависимости, учитывающий состав включаемых признаков, должен быть известен априори;
• входные переменные модели должны быть заданы без ошибки и не коррелированны между собой;
• ошибка наблюдений выходной величины должна быть аддитивной, нормально распределенной, с постоянными математическим ожиданием и дисперсией;
• выборка данных должна быть репрезентативной, а исследуемый процесс стационарным.
Очевидно, что в рассматриваемой задаче нс выполняется ни одно из этих требований и исследуется некоторый иной, чем заявленный в задаче процесс, для которого и получены показатели надежности модели. Очевидно, что при увеличении объема инвестиций (интенсивность рекламной деятельности) действительно до некоторых пор будет увеличиваться выпуск продукции. Потом произойдет насыщение, и эффективность процесса упадет. Новые инвестиции (усилия маркетологов) не дадут ожидаемого эффекта. Модель должна содержать соответствующие слагаемые. Например, это квадратичные члены от х2 и х5, имеющие отрицательные знаки. В противном случае следует четко указать, для каких интервалов данных построена модель (область выполнения приведенного соотношения). Вне этой области выводы не распространяются, т.е. прогноз невозможен в принципе. Производительность не вошла в модель по простой причине: предприятия не могли варьировать этой величиной на практике. Анализ результатов моделирования в рассматриваемой задаче можно продолжать в этом духе и далее.
Причина кроется в нарушении предпосылок применения методов: в действительности вид искомой зависимости априори неизвестен, входные факторы заданы с ошибкой и коррелированы между собой, информация о виде и параметрах ошибки выходной величины отсутствует. Таким образом, арсенал математических методов остается невостребованным или его применение ведет к ложным выводам и снижает качество принимаемых решений.
На этапе подготовки к математическому моделированию следует выделить три проблемы:
• очисление данных качественного и (или) лингвистического характера;
• отбор информативных данных для исследования факторов;
• формирование признакового пространства исследования.
Систематизация методов масштабирования и нормирования. Первые две указанные проблемы достаточно очевидны и уже имеют развитые методы решения. Ограничимся указанием популярных литературных источников. В первом случае это шкалирование данных, логико-лингвистическое моделирование. Во втором – метод главных компонент, корреляционный и дисперсионный анализ, теория распознавания образов. Остановимся подробнее на третьей проблеме.
Сущность ее состоит в следующем: данные, получаемые для исследования, имеют разную размерность, разный "вес" (значимость) для решения проблемы. Так, в примере 6.7 стоимость основных производственных фондов предприятий измеряется в миллионах рублей, а балльная оценка маркетинговой деятельности, количество видов выпускаемой продукции – в единицах.
Следует различать два подхода к преобразованию данных для моделирования: независимое преобразование данных (каждая переменная преобразуется независимо от других) и сочетанное (переменные преобразуются с учетом их взаимного влияния). К первым относятся масштабирование и нормирование. Они хорошо известны и описываются следующим образом.
Масштабирование переменных позволяет перевести их к безразмерному виду и к стандартным интервалам изменения. Наиболее распространенными являются интервалы [0; 1] и [–1; 1]. Если некоторая переменная х изменяется на промежутке [а; b], то преобразовать ее в первый интервал [0; 1] можно с помощью соотношения
(6.9)
Преобразовать этот же промежуток в интервал [–1; 1] позволяет формула
(6.10)
Если область изменения исходной переменной не фиксирована, то часто используют соотношения, аналогичные (6.9) и (6.10):
(6.11)
где хmах – максимальное из наблюдаемых значений х, хmin – минимальное.
Выше (см. параграф 5.1) при рассмотрении иллюстративных примеров мы уже воспользовались указанной процедурой.
Нормирование переменных выполняется по формуле
(6.12)
где хср – среднее значение наблюдаемых показателей х; δx – среднеквадратическое отклонение переменной х.
Нормирование преследует иные цели. В этом случае новая переменная и имеет нулевое среднее и единичную дисперсию разброса.
Развитие метода сочетанного масштабирования данных. Сочетанное преобразование совокупности данных подробно рассмотрено в научной литературе, но ориентировано для узкого круга пользователей, хорошо владеющих математическим аппаратом исследования.
Ниже рассмотрен упрощенный вариант решения проблемы, основанный на использовании экспертных знаний, способности экспертов сравнивать близость и различие исследуемых ситуаций.
Развиваемый метод хорошо иллюстрирует пятый уровень сложности объектов, при котором рекомендуется использовать технологии искусственного интеллекта (см. параграф 5.2).
Для удобства решения задачи рассмотрим двухмерный случай: моделируемые объекты задаются только двумя признаками х1 и х2. Обобщение полученного решения задачи на большую размерность – очевидно.
Используется обобщенная мера близости между исследуемыми объектами:
(6.13)
Коэффициент а является и искомым масштабирующим коэффициентом, выравнивающим масштаб переменных х1 и х2, и учитывающим их взаимное влияние на исследуемый процесс.
В установленной системе признаков х10х2 выбирается базовый (эталонный) объект исследования , моделируемый точкой в соответствующем при знаковом пространстве.
Пример 6.8. Исследуется деятельность туристической компании. Ее услуги – туристические поездки, которые оцениваются в нашем примере двумя параметрами: х1 – продолжительность тура и х2 – его цена. В качестве точки М выберем тур с параметрами недели, тыс. долл. .
В этой же системе координат экспертом называются еще несколько точек-моделей, равноотстоящих (но мнению эксперта) от базовой точки М. Обозначим их соответственно и т.д. В нашем примере это: N(2; 4), К(8; 2).
Пусть в расчетном примере (рис. 6.5, а):
(6.14)
Визуально расстоянием между точками М и N меньше расстояния между объектами М и К. Опыт "подсказывает" эксперту иное соотношение между переменными: расстояния MN и МК должны быть равны между собой (изменение цен и продолжительностей туристической поездки в указанных направлениях приводит к одинаковым изменениям в спросе на их продукцию). После несложных преобразований: подстановки (6.14) в (6.13) и решения полученного уравнения относительно а, получим
Соотношение (6.13) примет вид:
(6.15)
Если ввести коэффициент а внутрь скобки, получим:
(6.16)
Тогда, после переобозначения переменных:
(6.17)
соотношение (6.16) приобретает вид классического (геометрически обоснованного) евклидова расстояния:
(6.18)
На рис. 6.2, б масштаб по вертикальной оси увеличился в два раза, и визуально расстояния MN и МК равны между собой, как и предполагает эксперт.
В общем случае преобразование переменных имеет вид
(6.19)
Рис. 6.5. Графическая иллюстрация метода сочетанного масштабирования:
а – расположение исследуемых объектов в признаковом пространстве до преобразования переменных; б – расположение исследуемых объектов в признаковом пространстве после преобразования переменных
Справка. Приведенные расчеты иллюстративны. Для повышения их достоверности статистика должна быть репрезентативной, т.е. отражать все множество возможных сочетаний исследуемых объектов и быть достаточной для статистически обоснованных расчетов.
Так как эксперт задает данные с ошибкой, то система уравнений относительно искомых коэффициентов будет, очевидно, несовместной (математически некорректной). Решение рекомендуется получать методом квазирешения.