Задача математической статистики

Лекция 8. Элементы математической статистики

Основные понятия математической статистики

Статистическое исследование начинается со сбора данных. Для этого производится опытов (наблюдений) и регистрируются их результаты. Если - значение исследуемой случайной величины , полученное -м опыте, то последовательность называют выборкой. Число опытов называется объемом выборки. Выборка является исходным материалом для всех дальнейших статистических выводов о случайной величине . Ясно, что значения сами являются случайными величинами. Предполагается, что все независимы и распределены так же, как и порождающая их случайная величина

Если элементы выборки записать в порядке их возрастания, то полученная последовательность будет называться вариационным рядом. Разность между максимальным и минимальным элементами выборки называют размахом выборки. Если в выборке объема элемент встречается раз, то число называют частотой элемента , а последовательность пар статистическим рядом. Обычно статистический ряд записывают в виде таблицы, первая строка которой содержит элементы , а вторая –их частоты .

При большом объеме выборки ее элементы объединяют в группы (разряды), представляя результаты опытов в виде группированной выборки. Для этого весь интервал значений выборки разбивают на частичных интервалов или разрядов; в зависимости от объема выборки число интервалов берется от 6 до 20. Затем для каждого интервала подсчитывают число значений выборки, попавших в этот интервал. Очередное значение Числа называются частотами. Результат этой группировки сводится в таблицу (см. табл. 8.1). Первые три колонки этой таблицы и представляют группированную выборку. Наряду с частотами одновременно подсчитываются и заносятся в таблицу представители интервалов, в качестве которых обычно берут середины интервалов , относительные частоты и плотности относительных частот Для контроля правильности вычислений следует проверить равенства

Статистической (или выборочной) функцией распределения случайной величины по имеющейся выборке называется функция F * (x), равная относительной частоте события

, то есть , где число значений в выборке, меньших x; n объём выборки. Гистограммой называется совокупность прямоугольников, основаниями которых служат частичные интервалы, а высоты равны соответствующим плотностям относительных частот. Если середины верхних сторон прямоугольников соединить ломаной линией, то полученная ломанная называется полигоном. Гистограмма и полигон могут служить некоторым приближением графика неизвестной плотности распределения

случайной величины . Точность приближения возрастает с ростом объема выборки и количества частичных интервалов.

В некоторых случаях строят полигон абсолютных частот, представляющий собой ломаную, отрезки которой соединяют точки где варианты выборки а соответствующие им частоты. Он так же позволяет судить о предполагаемом законе распределения случайной величины Х.

Пример 8.1. Записать в виде вариационного и статистического рядов выборку 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4.

 

Т а б л и ц а 8.1

Решение. Объем выборки . Упорядочив элементы выборки по величине, получим вариационный ряд 2, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10 . Статистический ряд записывается в виде таблицы

 

Пример 8.2.Представить выборку из 55 наблюдений в виде группированной выборки, используя 7 интервалов равной длины. Построить гистограмму и полигон. Выборка имеет вид:

17 19 23 18 21 15 16 13 20 18 15 20 14 20 16 14 20 19 15 19 16 19

15 22 21 12 10 21 18 14 14 17 1613 19 18 20 24 16 20 19 17 18 18

21 17 19 17 13 17 11 18 19 19 17 .

Решение. Размах выборки . Длина интервала 14/7=2. Результаты группировки сводим в табл.8.2.

Т а б л и ц а 8.2

 

Рис. 8.1.Полигон и гистограмма выборки

 

Пример 8.3.Записать эмпирическую функцию распределения для выборки, представленной статистическим рядом.

 

 

Решение.

 

 

 

Задача математической статистики

В задачу математической статистики входят оценки неизвестных параметров распределения:

1.точечные оценкипараметров распределения, например оценка математического ожидания, дисперсии, моментов распределения;

2. интервальные оценки (доверительные интервалы)– интервалы, в которых находятся параметры распределения с доверительной вероятностью;

3. проверка статистических гипотез – проверка предположений о законе распределения генеральной совокупности (ГС; см. ниже) или параметрах распределения;

4. установление формы и степени связи между несколькими случайными переменными.

Перейдем к выполнению этой задачи на основе результатов, полученных в теории вероятностей.