Четырехфакторный иерархический дисперсионный анализ 4 страница

 
 
Рис .3. Дендрит максимальных коэффициентов сходства между кластерами сеянцев алычи по комплексу 10 признаков


 
 
Рис .4. Кластеры второго порядка из 21 кластера сеянцев алычи по комплексу 10 признаков (уровень разрезания максимальных связей <0,55)


Рис. 5. Состав 10 кластеров второго порядка с указанием исходных номеров сеянцев

7. Проводим максимальный корреляционный путь по Выханду на матрице межкластеных коэффициентов сходства (табл.5), строим дендрит максимальных межкластеных коэффициентов сходства, состоящий из 21 кластера (рис.3) и разрезаем дендрит по относительно слабым связям (менее 0,55) и выделяем 10 кластеров второго порядка (рис. 4). Заменяем номера кластеров на исходные номера объектов (сеянцев алычи), кластеры, содержащие более одного сеянца представляем в виде кластеров первого порядка (рис.5)

 

9. Выводы:

а) анализ 435 коэффициентов сходства между 30 сеянцами алычи по комплексу 10 номинальных признаков позволил выделить 21 кластер сходных между собой сеянцев следующего состава:

 

№ кластера № образца № кластера № образца № кластера № образца
кластер 1 19, 24 кластер 8 кластер 15
кластер 2 5, 30 кластер 9 кластер 16
кластер 3 кластер 10 кластер 17 7, 29
кластер 4 6, 22 кластер 11 кластер 18
кластер 5 4, 8, 15, 26 кластер 12 21, 23 кластер 19
кластер 6 1, 14 кластер 13 кластер 20
кластер 7 кластер 14 кластер 21

 

б) анализ 210 средних межкластарных коэффициентов сходства позволил выделить 10 кластеров второго порядка, в пределах которых объекты относительно сходны по комплексу 10 признаков:

 

№ кластера № образца № кластера № образца
кластер I 6, 22 кластер VI 7, 10, 17, 18, 19, 20, 24, 25, 29
кластер II кластер VII
кластер III кластер VIII 2, 5, 12, 13, 27, 30
кластер IV кластер IX 4, 8, 15, 21, 23, 26
кластер V кластер X 1, 14

 

в) сеянцы № 3, 9, 11, 16, 28 обладают своеобразными комплексами 10 изученных признаков и не входят в кластеры первого и второго порядков.

 

Работа сдана «_______» ______________________ 20______ г.

Оценка работы __________________________________

Преподаватель ___________________________ ( )


Практическое занятие №10. Весовая таксономия: таксономический анализ Смирнова (6 часов)

 

 

1. Матрица исходных данных (табл.1) та же, что и при расчете коэффициентов сходства по Сокелу и Сниту, но имеются 3 дополнительные строки: 1) сумма частот встречаемости каждой модальности; 2) вес k-ой модальности по ее присутствию (wk+); 3) вес k-ой модальности по ее отсутствию (wk-).

 

где N – общее число объектов; nk = число объектов, у которых k-ая модальность присутствует.

Например, вычислим веса по присутствию и отсутствию узко-яйцевидной формы листовой пластинки (k=1):

 

Вычисляем веса всех 38 модальностей по их присутствию и отсутствию.

 

2. Коэффициенты сходства по Смирнову вычисляются по формуле:

где М – общее число модальностей, wk – вес по присутствию (совпадение пары объектов по единицам) или отсутствию (совпадение пары объектов по нолям). Всякому несовпадению двух объектов по модальностям приписывается один и тот же вес «–1».

Коэффициенты сходства вычисляются попарно во всех возможных сочетаниях и сводятся в матрицу коэффициентов сходства (табл.2).

По диагонали матрицы расположены коэффициенты сходства объекта с самим собой – коэффициенты оригинальности, представляющие собой средние веса всех модальностей по их присутствию и отсутствию у каждого объекта.

 

3. Матрица коэффициентов сходства обрабатывается максимальным корреляционным путем в программе Excel. В табл. 3 представлена заключительная стадия данного алгоритма.

На основе результатов максимального корреляционного пути изображается дендрит максимальных коэффициентов сходства 30 сеянцев алычи по комплексу 10 признаков (рис. 1)

Дендрит разрезается на кластеры по относительно слабым связям (коэффициент сходства менее 0,30), в результате образуется 12 кластеров (рис.2)

 

4. Для проверки корректности разделения дендрита на кластеры вычисляются средние коэффициенты сходства внутри каждого кластера и между кластерами, которые сводятся в матрицу (табл.4). Средние внутрикластерные коэффициенты сходства должны превосходить средние межкластерные коэффициенты сходства.

 


 

 

Табл.1

 

Матрица исходных данных в оцифрованной (0/1) номинальной шкале и веса модальностей по их присутствию (w+) и отсутствию (w-)

 

 

№ обрацза Форма листовой пластинки Форма основания листа Окраска листа Опушение листа снизу Поражение морозами Дата начала цветения Диаметр цветка Окраска кожицы плода Масса плода Вкус плода
узк.яйц. узк.ов. узк.обр.яйц. ов. ов.яйц. ов.обр.яйц. шир.яйц. шир.ов. шир.обр.яйц. округлая окр.-конич. коническая зеленая темно-зеленая антоциановая отсутствует слаб. или ср. сильное 1 балл 2-4 балла 5 баллов 29.04.-04.05. 05.05.-10.05. 11.05.-16.05. 14-18 мм 19-23 мм 24-28 мм зеленая желтая оранжевая красная 13-20 г 21-28 г 29-36 г 37-44 г 3,0-3,4 балла 3,5-3,9 балла 4,0-4,4 балла
Σ                                                                            
w+                                                                            
w-                                                                            

 


Табл.2

Матрица коэффициентов сходства по Смирнову 30 сеянцев алычи по комплексу 10 признаков