Метод по критерию однородности

Рядом исследователей решение задачи по выделению однородных районов проведено на основе использования предложенного Д. А. Родионовой критерия однородности географических объектов по комплексу признаков:

где – объекты сравниваемых совокупностей; средние значения признака в сравниваемых совокупностях; – дисперсия по признаку j, общая для сравниваемых совокупностей.

Сравниваемые совокупности но изучаемым признакам считают однородными, если не превышает распределения

"хи-квадрата" при числе степеней свободы п и определенном уровне доверия. В основу их выделения положено представление о статистической однородности. Если у множества объектов , охарактеризованных признаком х, все его значения являются реализациями одной случайной величины с функцией распределения , то совокупность относится к одному классу. Район обладает свойствами однородности, если сохраняется следующее условие:

где и – функции распределения вероятности значений, принимаемых переменной х в выборках i и j из одной совокупности.

Т. П. Куприянова показала, что распределение может быть одномерным и многомерным (при различной комбинации характеристик). Тогда оценка однородности сводится к проверке одновершинности кривой распределения. Однородными районы будут в том случае, если различия, определяемые с данной доверительной вероятностью, несущественны.

В качестве алгебраического решения целесообразно (но сравнению с другими критериями однородности) воспользоваться критерием , особенно, как показала Т. П. Куприянова, при (п – число объектов; т – число признаков).

Выделение районов проводят в два этапа. Сначала проверяют гипотезу об однородности. При наличии однородности величина должна быть распределена по закону (при определенном уровне доверия и данных степенях свободы). В этом случае должно выполняться условиедля всех рассматриваемых подмножеств. В случае невыполнения этого неравенства, хотя бы для одного варианта разбиения, ведут поиск границ. В качестве основной границы выбирают вариант, при котором .

Метод дистанционного коэффициента

Возможность сопоставления районов по комплексу признаков дает метод дистанционного коэффициента (d). Он успешно был применен А. Е. Фединой для классификации региональных географических комплексов Северо-Восточного Кавказа по ряду качественных и количественных показателей признаков. Коэффициент d является мерой расстояния между двумя точками в n-мерном пространстве. Его применяют для оценки сходства между двумя многомерными совокупностями.

Цель метода – отнесение к единой группе однородных районов, т.е. имеющих близкие показатели различных признаков в n-мерном пространстве. Принцип разделения двух совокупностей точек в этом пространстве заключается в том, что внутри одной совокупности точки лежат ближе друг к другу, но дальше от точек другой совокупности.

Разбиение множества объектов на группы осуществляют по критерию близости. Количественно близость между двумя объектами определяется следующим образом:

Из вычисленных значений по всем группам значений составляется матрица, симметричная относительно главной диагонали. Анализ матрицы заключается в том, чтобы с учетом географических особенностей установить минимальное значение (), которое указывает на однородность сравниваемых районов. Классификация осуществляется путем постепенного последовательного укрупнения районов, т.е. путем слияния "близких" по комплексу признаков из ранее выделенных.

Существуют три способа районирования с использованием рассматриваемого метода.

Первый способ основан на выделении минимального значения как показателя "близости" сравниваемых районов. Каждый шаг такого исследования позволяет объединять территориальные единицы по величинеТакой способ применяли, например, И. В. Мымрин и Н. В. Перепечина при выделении территориально-производственных сочетаний Иркутской области. Строится матрица размерностью "территориальные единицы – территориальные единицы". В ней выделяются районы, в которых (данные районы объединяются). После первого шага определяется новая матрица, состоящая из п – 2 оставшихся элементов и выделившейся группы А. Группа А принимается теперь как один элемент (территориальная единица). При следующем шаге опять определяетсяи вся операция повторяется вновь.

Для оценки каждой группы элементов (территориальных единиц) используют критерий, выраженный величиной , где – теснота связи между группами; – теснота связи внутри них. При выборе заданного числа групп, соответствующего минимальной величине группировка элементов заканчивается.

Второй путь основан на введении искусственных величин пороговых значений признаков. Однако, как считают И. В. Мымрин и Н. В. Перепечина, вводя их, мы тем самым значительно сужаем область существования возможных решений, т.е. делаем какую-то предварительную классификацию территории.

Существует еще третий способ – сопоставление территориальных единиц с эталонной, выбранной среди изучаемых. В частности, этот способ был применен А. Е. Фединой. Для каждой из всех территориальных единиц ей была рассчитана величина d, которая сравнивалась с величиной этого критерия, принятой за эталон. Результаты сравнения позволили выделить на изучаемой территории по критерию близости с помощью его пороговых значений районы, округа, провинции.

В некоторых работах проводятся попытки уточнения , сводящиеся главным образом к введению коэффициентов взвешивания перед скобкой квадрата разности либо к замене квадратной степени на большие по величине. Однако эти произвольные построения не имеют сколь-нибудь заметных преимуществ по сравнению с приведенным значением , а лишь значительно усложняют расчеты.

В данном случае используют таблицу , которая представляет матрицу размерностью "признаки – объекты (территориальные единицы)". При рассмотрении распределения признака по территориальным единицам, можно выявить разницу между характером распределений признаков 1 и 2, распределений признаков 2 и 3 и т.д. Сопоставление распределения одного признака с распределением другого может быть осуществлено с помощью критерия "хи-квадрат"

где – распределения признаков.

Затем и в матрице сопряженности признаков производят суммирование по строкам и столбцам и получают итог для каждого из рассматриваемых показателей. Показатели, для которых , могут служить эффективным индикатором для районирования. В дальнейшем территориальные единицы разбивают на группы с видом-индикатором и без него (т.е. вида с ). Следующий шаг районирования – разбиение этих групп на основе наличия или отсутствия признака со следующей величиной после максимальной суммы и т.д.