Поняття про інші методи багатовимірного статистичного аналізу
Багатовимірний статистичний аналіз визначається, як розділ матема-тичної статистики, яка присвячена методам побудови оптимальних планів збору, систематизації і обробці багатовимірних статистичних даних, на-правлених на виявлення характеру і структури взаємозв’язків між ком-понентами досліджуваної ознаки і призначених для отримання наукових і практичних висновків.
Багатовимірні статистичні методи серед множини можливих ймовір-ностно-статистичних моделей дозволяють обгрунтовано вибрати ту, яка найкращим чином відповідає вихідним статистичним даним, які характе-ризують реальну поведінку досліджуваної сукупності об’єктів, оцінити надійність і точність висновків, зроблених на основі органічного статис-тичного матеріалу.
Зробимо короткий огляд ряду інших методів багатовимірного статистичного аналізу, які вже знайшли відображення в статистичних пакетах прикладних програм. В першу чергу, потрібно виділити методи, які дозволяють виявити загальні (латентні) фактори, що визначають варіацію першочергових факторів. До них відносяться факторний аналіз і метод головних компонент.
Факторний аналіз. Основним завданням факторного аналізу є перехід від першочергової системи великого числа взаємопов’язаних факторів до відносно малого числа закритих (латентних) факторів , k<m. Наприклад, продуктивність праці на підприємствах залежить від багатьох факторів (освітнього рівня працівників, коефіцієнта змінності обладнання, енергозабезпеченості праці, віку обладнання, кількості місць у столових і т. д.), з яких багато зв’язані між собою. Використовуючи факторний аналіз, можна встановити вплив на зростання продуктивності праці лише декількох узагальнених факторів (наприклад, розмір підприємства, рівня організації праці і характеру продукції), які безпосередньо не спостерігались.
Модель факторного аналізу записується у вигляді:
(2)
де - математичне сподівання першочергового фактору ;
- загальні (скриті або латентні) фактори (j = 1, 2, …, k);
- навантаження першочергових факторів на загальні фактори;
- характерні фактори (i = 1, 2, …, m);
- навантаження першочергових факторів на характерні фактори.
Перший доданок в моделі (2) – невипадкова складова, інші два доданки – випадкові складові.
Особливістю факторного аналізу є неоднозначність визначення загальних факторів.
Метод головних компонент (компонентний аналіз)
На відміну від розглянутих у факторному аналізі загальних факторів, які обумовлюють велику частину варіації першочергових факторів, головні компоненти пояснюють всю варіацію і визначаються однозначно. Модель головних компонент має вигляд: (3)
Як бачимо, в моделі (3) відсутні характерні фактори, оскільки головні компоненти повністю обумовлюють всю варіацію першочергових факторів. Для поглиблення аналізу явища, яке вивчається, після виявлення головних компонент розглядають регресію на головних компонентах, в яких останні виступають в якості узагальнених пояснюючих змінних.
Серед інших методів багатовимірного статистичного аналізу відмітимо методи, які дозволяють реалізувати класифікацію економічних об’єктів, тобто відношення їх до відповідних класів. Це методи дискримінантного і кластерного аналізу.
Дискримінантний аналіз дозволяє віднести об’єкт, який характеризується значеннями m ознак, до одної з l сукупностей (класів, груп), заданих своїми розподілами. Припускається, що l сукупностей задані вибірками (які називаються навчальними), які містять інформацію про статистичні розподіли сукупностей в m-вимірному просторі ознак.
При відсутності навчальних вибірок можуть бути використані методикластерного аналізу, що дозволяють розбити досліджувану сукупність об’єктів на групи “схожих” об’єктів, які називаються кластерами, таким чином, аби об’єкти одного класу знаходились на “близьких” відстанях між собою, а об’єкти різних класів –на відносно “віддалених” відстанях один від одного. При цьому кожен об’єкт розглядається як точка в m-вимірному просторі, і вибір способу обчислення відстані чи близькості між об’єктами та ознаками є вузловим моментом дослідження, від якого в основному залежить кінцевий варіант розбиття об’єктів на класи.
Додаток 4