Кластеризация многомерных данных

Лабораторная работа №4

по курсу: «Анализ данных и знаний»

Кластеризация многомерных данных

Цель работы: приобретение практических навыков решения задачи кластеризации многомерных данных.

 

Задачи работы:

1) выполнить генерацию исходной выборки данных (50 объектов, каждый из которых описывается 2 признаками), используя следующий генератор:

 

 

где - равномерно распределенные числа в интервале от 0 до 1 для генерации двух значений признаков i-ого объекта выборки; - параметры генераторов, выбираемые из таблицы 1 согласно номеру студента в журнале;

 

2) реализовать программно кластеризацию полученной выборки данных с помощью алгоритма:

- четный номер студента в журнале – алгоритм k-средних с числом кластеров ;

- нечетный номер студента в журнале – алгоритм максиминного расстояния;

 

3) визуализировать полученные результаты кластеризации и оценить качество результатов кластеризации.

 

Содержание отчета:

1) введение;

2) описание реализуемого алгоритма кластеризации;

3) результаты работы (экранные формы с анализом полученных результатов);

4) выводы;

5) листинг программы.


Таблица 1 - Параметры генераторов

Вариант