Генеральная совокупность и выборка. Математическая статистика в геоэкологических исследованиях

Лекция 3. ОЦЕНКА ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ

В ГЕОЭКОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ

Математическая статистика в геоэкологических исследованиях

Основные задачи математической статистики

Как отмечалось выше описания рассматриваемых процессов в геоэкологии, выводы и прогнозы о их возможных состояниях делаются на основе рядов наблюдений. В тоже время ряды наблюдений, как правило, ограничены во времени и освещают лишь какой то ограниченный период рассматриваемых процессов. Нам же необходимо на основе этих рядов, то есть, по сути, на основе имеющихся наблюдений, сделать выводы обо всем процессе.

 

Математическая статистика — наука, занимающаяся разработкой методов получения научно обоснованных выводов о массовых явлениях и процессах на основе данных наблюдений или экспериментов

 

Эти выводы относятся не только к имеющемуся ряду наблюдений или серии испытаний, а представляют утверждения об общих вероятностных характеристиках данного процесса, т. е. об его законе распределения и числовых характеристиках. Именно такое использование исходных данных является отличительной, чертой математической статистики.

При переходе от данных наблюдений или серии опытов, как. правило, ограниченных по объему, к характеристике всего процесса возникает ряд трудных задач. Наиболее типичными из них являются

1. Оценка неизвестной функции распределения рассматриваемого процесса на основе данных наблюдений.

Задача ставится так: за ограниченный период наблюдений в п лет получен ряд значений случайной величины X (x1, х2,…...., хп). Требуется по этому ряду наблюдений (выборке) определить неизвестную функцию распределения F(x) случайной величины X:

2. Оценка неизвестных параметров распределения.

Известно, что случайная величина X имеет функцию распределения F(x), зависящую от k неизвестных параметров. Требуется на основании опытных данных, т. е. по ряду ограниченной продолжительности, определить значения этих параметров.

3. Статистическая проверка гипотез.

— предполагается, что функция распределения ряда X есть Fx (наша гипотеза). Спрашивается: совместимы ли наблюденные значения X (x1, х2, .. ., хп) с этим предположением;

___ предполагается, что значения параметров распределения генеральной совокупности имеют некоторые определенные значения (наша гипотеза). Не опровергают ли опытные данные эту гипотезу?

В основе применения математической статистики лежит ряд исходных понятий, без предварительного изучения которых невозможно использование современных методов обработки результатов наблюдений или опытных данных. Остановимся на некоторых из них.

В исследованиях окружающей среды анализ исходных данных производится таким образом, что в качестве репера, к которому привязываются результаты исследований, обычно выступает гене­ральная совокупность.

 

Генеральная совокупность и выборка

Генеральная совокупностьмножество, включающее в себя все однородные объекты (на­пример, все деревья в лесу, все данные об уровнях за период существования водного объекта и т. д.), которым присущи или не присущи определенные количественные или качественные признаки

В соответствии с числом объектов гене­ральные совокупности могут быть конечными и бесконечными.

Основное отличие генеральной совокупности заключается в том, что все числовые характеристики и закон распределения случайной величины X могут быть установлены по этой совокупности значений с точностью, равной точности определения исходных данных.

В исследованиях, связанных с анализом состояния окружающей среды, в качестве генеральной совокупности обычно принимается ряд наблюдений бесконечной продолжительности. Однако продолжительность рядов наблюдений за природными явлениями, как уже отмечалось, ограничена. Так, период непрерывных инструментальных наблюдений за стоком и другими гидрологиче­скими процессами лишь в исключительных случаях достигает 100—150 лет, Ряды регулярных наблюдений за концентрациями загрязняющих веществ в реках в лучшем случае достигают 50 – 60 лет. Таким образом, если обозначить имеющуюся длительность гидрологических рядов через п, то во всех случаях n<<∞.

 

Выборочная совокупность (выборка) – ряд наблюдений за короткий период в п лет, взятый из генеральной совокупности

Ряды наблюдений, которыми располагают геоэкологи, в подавляющем числе случаев, являются выборочными, так как освещают лишь какой-то короткий период развития рассматриваемых процессов. Причем характерной особенностью выборок в в данном случае, является то, что их берут не произвольно, как обычно принято в статистике, а лишь за последний период развития данного процесса.

Располагая ограниченным по времени материалом наблюдений, мы хотим распространять полученные по ним выводы на весь процесс в целом, а не только на ту часть, которая попала в орбиту нашего внимания. Такая экстраполяция выводов может быть, оправдана только в том случае, если ограниченный материал наблюдений является представительным или репрезентативным, для всего процесса

 

Представительная выборка — выборка, достаточно хорошо представляющая пропорции генеральной совокупности.

Все современные методы расчетов колебаний стока связаны с гипотезой, полагающей, что ряды наблюдений за стоком при отсутствии антропогенных изменений последнего являются представительными выборками генеральной совокупности, освещающей, весь процесс стока.