Формирование признакового пространства исследования социально-экономических систем

Постановка проблемы. Задачи управления социально-экономическими объектами и процессами, рассматриваемые в рамках менеджмента, носят, как правило, "гуманитарный" характер. Вот типичные примеры.

1. Решается проблема реструктуризации предприятия. На основании проведенного СТЭП-анализа руководством предприятия, приглашенными экспертами обсуждаются параметры проводимых изменений: степень вовлеченности коллектива в процесс реструктуризации, скорость проведения преобразований, меры по компенсации сопротивления изменениям (образование и участие, помощь и поддержка, переговоры и манипуляции, явное и скрытое принуждение). Сама технология изменений проводится в три этапа: "размораживание" преобразуемой ситуации, собственно проведение изменений, "замораживание" достигнутой ситуации.

2. Осуществляется управление развитием предпринимательства в регионе. С этой целью проводится мониторинг состояния экономики и предпринимательства. На основании SWOT-анализа, выявляющего сильные и слабые стороны процесса, возможности и угрозы, разрабатываются меры по облегчению предпринимательской деятельности (снижение налогового бремени, создание инвестиционных фондов, упрощение процедур открытия малого бизнеса и систем отчетности и т.д.), проводится обучение основам бизнеса и предпринимательства.

3. Принимается на работу на фирму новый сотрудник. С ним проводят собеседование, выявляют соответствие имеющихся у него компетенций (личностных, профессиональных) с требуемыми компетенциями (портретом специальности) по существующему регламенту работ, на выполнение которых принимается сотрудник.

Аналитические методы исследования в этих и аналогичных задачах имеют, к сожалению, в настоящее время в менеджменте второстепенное значение. Причины такого положения две:

• методы моделирования и оптимального принятия решений рассматриваются в иных дисциплинах: эконометрика, теория оптимального принятия решений, управленческие решения. Специалисты в области математического моделирования и принятия решений разобщены с практиками-управленцами;

• математические методы требуют выполнения жестких условий, которые, как правило, на практике нс выполняются и практикующим исследователям неизвестны. Вот характерный пример.

Пример 6.6. Строится регрессионная зависимость прибыли, получаемой предприятием, от следующих факторов: объем выпускаемой продукции, назначаемая цена, качество продукции, набор потребительских свойств, реализуемых продуктом, и пр. Искомая зависимость позволила бы решить ряд практически важных задач: прогноз поступлений прибыли в зависимости от вариаций того или иного фактора, оптимизация процесса производства.

Применение классических методов моделирования, основанных на методе наименьших квадратов, имеет ряд жестких ограничений. Вот некоторые из них:

• входные факторы заданы без ошибок и некоррелированны между собой;

• выходная величина задана с аддитивной ошибкой, распределенной по нормальному закону с нулевым математическим ожиданием и постоянной дисперсией;

• вид искомой зависимости известен.

Эти ограничения на практике или не выполняются в полном объеме, или являются трудно проверяемыми, что ограничивает область адекватного применения аналитических подходов. Применение математических методов без учета высказанного обстоятельства ведет в лучшем случае к ошибкам в моделировании (дезинформации участников процесса), в худшем – к отрицательным социально-экономическим последствиям. Вновь обратимся к примеру.

Пример. 6.7. "Для определения прогнозных показателей производства мяса и мясных продуктов (в пересчете на мясо) мясоперерабатывающей промышленностью Ростовской области с помощью корреляционно-регрессионного моделирования в качестве результативного показателя Y был взят объем производства мясной продукции (в пересчете на мясо, тыс. т) тремя предприятиями-представителями, а в качестве факторов были взяты следующие переменные: x1 стоимость основных производственных фондов предприятий-представителей, млн руб. в сопоставимых ценах на одного среднегодового работающего; х2 – объем инвестиций, млн руб.; х3 – производительность труда, млн руб.; х4 фондовооруженность, предприятий-представителей, млн руб.; х5 балльная оценка маркетинговой деятельности по рекламе продукции, баллы; х6 – количество видов выпускаемой продукции, единиц; х7 – стоимость произведенной продукции в расчете на 1 т закупленного сырья, млн руб. в действующих ценах.

После решения математической задачи в регрессионную модель (6.8) вошло три фактора (х1, х2, х5), а уравнение регрессии приняло следующий вид:

Y = –6,737 + 0,153х1 + 0,308х2 + 1,322х5 . (6.8)

Коэффициент множественной регрессии R = 0,964 свидетельствует о достаточно высоком уровне связи, коэффициент детерминации R2 = 0,93 показывает, что свыше 93% изменений объемов валовой мясной продукции (в пересчете на мясо) зависит от включенных в модель факторов. T-коэффициенты (критерий Стьюдента) достаточно высоки (2,4–3,2).

Таким образом, прогноз, разработанный с использование корреляционно-регрессионного моделирования, показал, что объем выработки мясной продукции (в пересчете на мясо) в 2012 г. может вырасти на 82,8% в сравнении с 2006 г., в 2015 г. – на 101,9% соответственно".

Проанализируем результаты решения поставленной задачи. Согласно полученной модели объем производства мясной продукции Y не зависит от производительности труда х3. То есть о ней можно на производстве не беспокоиться. Зафиксировав на некотором уровне переменные х1 стоимость основных производственных фондов предприятий-представителей и х5 – балльную оценку маркетинговой деятельности по рекламе продукции, получим линейную функцию К(х2). Значит, управляя только объемом инвестиций (при прочих равных условиях), можно довести выпуск мясной продукции в области до любого (даже абсурдного) значения. Более того, аналогично можно вообще поставить выпуск мясной продукции в зависимость от рекламной деятельности. Очевидно, что это не так. Но почему вычислительная процедура, исполненная на многократно апробированном программном продукте, выдает более чем удовлетворительные показатели надежности модели R и R2?

В примере 6.7 для решения задачи применяют стандартный пакет построения регрессионной зависимости, не беспокоясь о том, выполняются ли следующие требования его применения:

• вид зависимости, учитывающий состав включаемых признаков, должен быть известен априори;

• входные переменные модели должны быть заданы без ошибки и не коррелированны между собой;

• ошибка наблюдений выходной величины должна быть аддитивной, нормально распределенной, с постоянными математическим ожиданием и дисперсией;

• выборка данных должна быть репрезентативной, а исследуемый процесс стационарным.

Очевидно, что в рассматриваемой задаче нс выполняется ни одно из этих требований и исследуется некоторый иной, чем заявленный в задаче процесс, для которого и получены показатели надежности модели. Очевидно, что при увеличении объема инвестиций (интенсивность рекламной деятельности) действительно до некоторых пор будет увеличиваться выпуск продукции. Потом произойдет насыщение, и эффективность процесса упадет. Новые инвестиции (усилия маркетологов) не дадут ожидаемого эффекта. Модель должна содержать соответствующие слагаемые. Например, это квадратичные члены от х2 и х5, имеющие отрицательные знаки. В противном случае следует четко указать, для каких интервалов данных построена модель (область выполнения приведенного соотношения). Вне этой области выводы не распространяются, т.е. прогноз невозможен в принципе. Производительность не вошла в модель по простой причине: предприятия не могли варьировать этой величиной на практике. Анализ результатов моделирования в рассматриваемой задаче можно продолжать в этом духе и далее.

Причина кроется в нарушении предпосылок применения методов: в действительности вид искомой зависимости априори неизвестен, входные факторы заданы с ошибкой и коррелированы между собой, информация о виде и параметрах ошибки выходной величины отсутствует. Таким образом, арсенал математических методов остается невостребованным или его применение ведет к ложным выводам и снижает качество принимаемых решений.

На этапе подготовки к математическому моделированию следует выделить три проблемы:

• очисление данных качественного и (или) лингвистического характера;

• отбор информативных данных для исследования факторов;

• формирование признакового пространства исследования.

Систематизация методов масштабирования и нормирования. Первые две указанные проблемы достаточно очевидны и уже имеют развитые методы решения. Ограничимся указанием популярных литературных источников. В первом случае это шкалирование данных, логико-лингвистическое моделирование. Во втором – метод главных компонент, корреляционный и дисперсионный анализ, теория распознавания образов. Остановимся подробнее на третьей проблеме.

Сущность ее состоит в следующем: данные, получаемые для исследования, имеют разную размерность, разный "вес" (значимость) для решения проблемы. Так, в примере 6.7 стоимость основных производственных фондов предприятий измеряется в миллионах рублей, а балльная оценка маркетинговой деятельности, количество видов выпускаемой продукции – в единицах.

Следует различать два подхода к преобразованию данных для моделирования: независимое преобразование данных (каждая переменная преобразуется независимо от других) и сочетанное (переменные преобразуются с учетом их взаимного влияния). К первым относятся масштабирование и нормирование. Они хорошо известны и описываются следующим образом.

Масштабирование переменных позволяет перевести их к безразмерному виду и к стандартным интервалам изменения. Наиболее распространенными являются интервалы [0; 1] и [–1; 1]. Если некоторая переменная х изменяется на промежутке [а; b], то преобразовать ее в первый интервал [0; 1] можно с помощью соотношения

(6.9)

Преобразовать этот же промежуток в интервал [–1; 1] позволяет формула

(6.10)

Если область изменения исходной переменной не фиксирована, то часто используют соотношения, аналогичные (6.9) и (6.10):

(6.11)

где хmах – максимальное из наблюдаемых значений х, хmin – минимальное.

Выше (см. параграф 5.1) при рассмотрении иллюстративных примеров мы уже воспользовались указанной процедурой.

Нормирование переменных выполняется по формуле

(6.12)

где хср – среднее значение наблюдаемых показателей х; δx – среднеквадратическое отклонение переменной х.

Нормирование преследует иные цели. В этом случае новая переменная и имеет нулевое среднее и единичную дисперсию разброса.

Развитие метода сочетанного масштабирования данных. Сочетанное преобразование совокупности данных подробно рассмотрено в научной литературе, но ориентировано для узкого круга пользователей, хорошо владеющих математическим аппаратом исследования.

Ниже рассмотрен упрощенный вариант решения проблемы, основанный на использовании экспертных знаний, способности экспертов сравнивать близость и различие исследуемых ситуаций.

Развиваемый метод хорошо иллюстрирует пятый уровень сложности объектов, при котором рекомендуется использовать технологии искусственного интеллекта (см. параграф 5.2).

Для удобства решения задачи рассмотрим двухмерный случай: моделируемые объекты задаются только двумя признаками х1 и х2. Обобщение полученного решения задачи на большую размерность – очевидно.

Используется обобщенная мера близости между исследуемыми объектами:

(6.13)

Коэффициент а является и искомым масштабирующим коэффициентом, выравнивающим масштаб переменных х1 и х2, и учитывающим их взаимное влияние на исследуемый процесс.

В установленной системе признаков х10х2 выбирается базовый (эталонный) объект исследования , моделируемый точкой в соответствующем при знаковом пространстве.

Пример 6.8. Исследуется деятельность туристической компании. Ее услуги – туристические поездки, которые оцениваются в нашем примере двумя параметрами: х1 – продолжительность тура и х2 – его цена. В качестве точки М выберем тур с параметрами недели, тыс. долл. .

В этой же системе координат экспертом называются еще несколько точек-моделей, равноотстоящих (но мнению эксперта) от базовой точки М. Обозначим их соответственно и т.д. В нашем примере это: N(2; 4), К(8; 2).

Пусть в расчетном примере (рис. 6.5, а):

(6.14)

Визуально расстоянием между точками М и N меньше расстояния между объектами М и К. Опыт "подсказывает" эксперту иное соотношение между переменными: расстояния MN и МК должны быть равны между собой (изменение цен и продолжительностей туристической поездки в указанных направлениях приводит к одинаковым изменениям в спросе на их продукцию). После несложных преобразований: подстановки (6.14) в (6.13) и решения полученного уравнения относительно а, получим

Соотношение (6.13) примет вид:

(6.15)

Если ввести коэффициент а внутрь скобки, получим:

(6.16)

Тогда, после переобозначения переменных:

(6.17)

соотношение (6.16) приобретает вид классического (геометрически обоснованного) евклидова расстояния:

(6.18)

На рис. 6.2, б масштаб по вертикальной оси увеличился в два раза, и визуально расстояния MN и МК равны между собой, как и предполагает эксперт.

В общем случае преобразование переменных имеет вид

(6.19)

Рис. 6.5. Графическая иллюстрация метода сочетанного масштабирования:

а – расположение исследуемых объектов в признаковом пространстве до преобразования переменных; б – расположение исследуемых объектов в признаковом пространстве после преобразования переменных

Справка. Приведенные расчеты иллюстративны. Для повышения их достоверности статистика должна быть репрезентативной, т.е. отражать все множество возможных сочетаний исследуемых объектов и быть достаточной для статистически обоснованных расчетов.

Так как эксперт задает данные с ошибкой, то система уравнений относительно искомых коэффициентов будет, очевидно, несовместной (математически некорректной). Решение рекомендуется получать методом квазирешения.