Выделение кластерной структуры оценки с использованием семантического дифференциала

Кластерный анализ, как и факторный, является процедурой редукции данных. С помощью кластерного анализа все множество данных разбивается на классы (кластеры, группы). Кластерный анализ имеет ряд преимуществ перед факторным.

1. Наглядность.

2. Простота.

3. Не теряются исходные данные.

Вместе с тем, кластерному анализу присущи и следующие недостатки факторного анализа.

1. Произвольная, основанная на "опыте" пользователя, интерпретация совокупности кластеров.

2. Недоказанность гипотезы о постоянстве кластерной структуры для двух и более генеральных совокупностей.

3. Процедуры кластерного анализа (например, оценка расстояний как корня из суммы квадратов разностей координат) требуют, чтобы измерения были проведены не ниже, чем по шкале интервалов, в то время как при применении семантических методик используется преимущественно шкала порядка (балльная оценка).

4. Отсутствуют процедуры оценки достоверности кластерных описаний.

Суть кластерного анализа состоит в том, что множество оцениваемых объектов (при применении СД – точек многомерной оценки в семантическом пространстве) классифицируется так, чтобы любые два объекта из одного кластера были более схожи (но заданному критерию), чем любые два объекта из разных кластеров. Переходя на образное, приблизительное, хотя важное для понимания, описание, можно сказать, что кластеры являются "сгущениями", "облаками" точек оценки стимула в многомерном семантическом пространстве (по многим шкалам СД). При использовании компьютерных статистических программ исследователи наиболее часто выбирают иерархический кластерный анализ.

При кластеризации матрицы данных оценки себя группой мужчин (см. табл. 6.1) с помощью 21 -шкального ЛСД (см. Приложение 12) была получена Вперед дендрограмма кластерного анализа (рис. 6.1).

Рис. 6.1. Дендрограмма с использованием метода межгрупповых связей

На первой ступени обсуждения (справа) мы выделяем два крупных класса оценки, объединяющих следующие шкалы оценки: первый класс (верхний на рисунке) объединяет оценки по шкалам 17, 20, 2, 12, 4, 8, 10, 16, 15, 6, 18, 21; второй класс объединяет оценки по шкалам 1, 13,19, 7,11, 9, 5, 14,3.

Обычно исследователь (произвольно) проходит но дендрограмме до уровня ветвления, на котором выделяются 5–10 классов оценок в зависимости от задачи.

На представленной дендрограмме можно выделить второй уровень ветвления (четыре класса оценок): первый класс объединяет оценки по шкалам 17, 20, 2, 12, 4, 8, 10, 16, 15, 6, 18. Во второй класс входит оценка по шкале 21. Третий класс объединяет оценки по шкалам 1, 13, 19, 7, И, 9, 5, 14. В четвертый класс входит оценка по шкале 3.

Далее можно, следуя по уровням ветвления дендрограммы, выделять большее количество все более мелких классов оценки.

Название классов (как и факторов) зависит от компетентности придумывающего объединительные по нескольким шкалам исследователя или привлеченных им экспертов. Например, выделенные четыре класса оценок можно назвать (см. шкалы в Приложении 12) следующим образом: первый класс – "никчемный человек – хороший человек", второй класс – "раздражительность – невозмутимость", третий класс – "героизм – эгоизм", четвертый класс – "разговорчивость – молчаливость".

Важно обратить внимание, что при трансформировании (повороте) матрицы данных дендрограмма покажет не кластеры шкал, а кластеры (группы) испытуемых с близкими оценками стимула. Это может быть использовано при глубоком исследовании уровней ценностно-ориентационного единства (ЦОЕ) испытуемых и при решении других аналогичных задач.

При выделении уровня класса оценки исследователь опирается на свой опыт (субъективизм) или на мнение приглашенных независимых, не знающих о стимуле и о цели исследования экспертов. На взгляд автора, имеет смысл остановиться на том уровне дендрограммы, на котором выделено 7 ± 2 кластера, что примерно равно объему оперативной (можно осмыслить все сразу) памяти человека. Выбрав уровень дендрограммы, нужно выписать соответствующие шкалы и, как и при факторном анализе, придумать для них обобщенное название.