clustering Two-way joining


OK

Cancel


Open D.ala

Рис. 2. Диалоговое окно кластерного анализа

Слева вверху в этом окне размещена кнопка Переменные (jg

J

Ее следует нажать, чтобы избрать те переменные, по которым вы бу­дете проводить кластерный анализ. После нажатия на эту кнопку воз­никнет новое диалоговое окно, представленное на рис. 4.

Поскольку нам для анализа потребуются все переменные, то вы­берите опцию Выбрать Все (Select All), после чего нажмите кнопку


Выбор переменных

Способ кластеризации

(по столбикам

или по строкам)

Стратегия кластеризации

Способ измерения расстояния


 

CtotfejAno :Ш&$ф,:

gy Variable*: ! попе Inputmaw data

~~*"^f.... '•"---------- —- '----- _____ _.

Cbstei: Vatiablei jcolumnsj ^ I

Amalgamation ffinkagej rule:. I Single Linkage Distance measure:


В


Рис. З. Параметры кластерного анализа

ОК. Так вы возвратитесь к окну параметров кластерного анализа (рис. 3). В большинстве случаев остальные параметры не изменяют, -так поступим и мы.

Select v<iiiables foi the analysis

OK


М П 4-KJ1

5-P_A


Cancel]


Выбрать все


       
 
   
 


SB

Select variables:

1-11


Рис. 4. Окно выбора переменных для кластерного анализа

Для начала кластерного анализа нажмите кнопку ОК. Перед вами (рис. 5) появится окно Результаты Объединения (Joining Results). Этой есть результаты кластерного анализа. Теперь, нажимая соответствую­щие кнопки, вы получите необходимые для анализа таблицы и графики,

Для описания результатов кластерного анализа нам будут важны следующие результаты:

);
|);
-&**&*#«*«****,

таблица расстояний ('д~. ■p таблица объединений (и

горизонтальное или вертикальное кластерное дерево (

или Ш




Горизонтальное и вертикальное кластерные деревья

Wunber of variables: 10 Vuibei of cases: ID Joining/ ot variables Hissing data ыесе саэеи1эе deleted Analgaiaaticn (Joining) rule: Single Li Diicance metric is: Kuciideiii distances

Таблица объединений

ЕЯ Hofi/ortdl hieraicbieal if ее plol

Таблица расстояний

[•■ Qectangulai bcancbet Г Scale Нее to dlink/dmaifi 00

[distance matiin Descriptive tl-atiilic*

Описательные S*статистики

juulgamalion tchedule

." 1 jiiaph of iim.ilgsmelion schedule

 


Рис. 5. Результаты кластерного анализа

Таблица расстоянии имеет следующий вид (рис. 6).

 

 

?? Euclidea   es (cla^ or.sta) К В Р А KB j В Д. П Р Д_К .    
Continue... .-   О В И П К 0 3 А ]
■ия ,0 13,3 14,8 13,4 13,5 11,5 14,4 13,6 12,3 12,8 12,8
"".о в • 13,3 £§ 6,2 7,0 7,3 5,9 16,8 12,9 21,7 21,7 21,7
-л п 14,86,2 ,0 6,8 6,7 8,0 14,9 12,4 20,4 20,4 20,4
к п 13,4 7,0 6,8 ,0 4,0 8,8 13,4 11,0 19,6 19,6 19,6
Р А ' 13,5, 7,3 6,7 4,0 ,0 8,9 ! 12,3 9,0 13,9 18,9 18,9 |
лл К" В \ 11,55,9 е,о 8,8 8,9 ,0 16,4 13,8 18,7 18,7 18,7
  14,4 16,8 14,9 13,4 12,3 16,4 ! ,0 6,6 12,9 12,9 12,9
*а р 13,6 12,9 12,4 11,0 9,0 13,8 6,6 ,0 16,0 16,0 16,0
д к 12,8; 21,7 20,4 19,6 18,9 18,7 . 12,9 16,0 ,0 ,0 ,0
Е 0 12,8: 21,7 20,4 19,6 18,9 18,7 ' 12,9 16,0 -0 ,0 ,0 1
• 3_А_ 12,8 21,7 20,4 19,6 13,9 18,7 12,9 16,0 ,0 ,0 ,0 :

Рис. 6. Таблица расстояний

Из этой таблицы можно получить информацию о расстояниях между отдельными объектами — чем больше числовое значение в определенной графе таблицы, тем больше расстояние между соответ­ствующими ей объектами.

Однако на основе анализа только одной таблицы расстояний тя­жело делать определенные обобщения и выводы. Более информатив­ной является таблица объединений (рис. 7):

Как видим, в этой таблице содержание кластеров представлено иначе — слева указаны расстояния (linkage distance), а вверху — коли­чество объектов в кластере. В самой же таблице размещены непо­средственно объекты. Тем самым уже более явно показано, что в дан-


jf5Jinwl§emat)en Schedule j«ks»r. la) ":> •'     ЯМ       ММ   XI.
Continue... ЕигШеад distance                
distance     CSj. [to.     да], но, ujJ. Ко. 3)j. No. В Ob]. No. .СО). Кй. . 11  
Ш--...Л Л к | lo                
  Й_К_ Е_0_ К И ^1 3_A_              
5.537,71 OB KB                
i,SB9S« □ В KB OB KB я и ED Г 1          
3,041571 OB- KB я п К П t 1 в д П Р      
■ 1US1DB6 10 OB к в я а к п р i В Д П Р    
13,ЭШ1 i 0 0 8 к в к п к п Р А в д_ ПР д к Е 0 Э A J
                 
                                           

Рис. 7. Таблица объединений

ном примере в первый кластер входят 2 объекта, во второй —- 3, а тре­тий образован 5 переменными и т. д.

Еще нагляднее результаты кластерного анализа можно предста­вить в виде кластерного дерева (рис. 8).

Tree Diagram for 11 Variables

Single Linkage Euclidean distances


       
   
 
 

10 12 14

 

 

 

 

 

 

 

 

 

 

 

       
         
гп h  
  п    
к„п_     k  
~1------------------------ '
       
J...J 1
р  
Д.К-  
э.л_    

0 2 4 6

Linkage Distance


Рис. 8. Кластерное дерево

Сохранение результатов кластерного анализа

Одним из элементов экспериментальной работы является грамот­ное представление ее результатов. В связи с этим после завершения


процедуры кластерного анализа необходимо адекватно изложить по­лученные данные с целью:

1) облегчить интерпретацию кластерных структур;

2) иметь возможность перенести числовые результаты в текст на­
учной работы;

3) убедить читателей работы в достоверности полученныхданных.

Именно поэтому все полученные в результате анализа данные должны быть представлены как в тексте {кластерное дерево), так и в приложениях (таблицы расстояний и объединений).

Для удобства работы все вышеназванные параметры нужно сохра­нить в виде файла Кластерный анализ.хЬ (формат Excel).