Задача математической статистики
Лекция 8. Элементы математической статистики
Основные понятия математической статистики
Статистическое исследование начинается со сбора данных. Для этого производится опытов (наблюдений) и регистрируются их результаты. Если
- значение исследуемой случайной величины
, полученное
-м опыте, то последовательность
называют выборкой. Число опытов
называется объемом выборки. Выборка является исходным материалом для всех дальнейших статистических выводов о случайной величине
. Ясно, что значения
сами являются случайными величинами. Предполагается, что все
независимы и распределены так же, как и порождающая их случайная величина
Если элементы выборки записать в порядке их возрастания, то полученная последовательность будет называться вариационным рядом. Разность между максимальным и минимальным элементами выборки называют размахом выборки. Если в выборке объема элемент
встречается
раз, то число
называют частотой элемента
, а последовательность пар
– статистическим рядом. Обычно статистический ряд записывают в виде таблицы, первая строка которой содержит элементы
, а вторая –их частоты
.
При большом объеме выборки ее элементы объединяют в группы (разряды), представляя результаты опытов в виде группированной выборки. Для этого весь интервал значений выборки разбивают на частичных интервалов или разрядов; в зависимости от объема выборки число интервалов
берется от 6 до 20. Затем для каждого интервала
подсчитывают число
значений выборки, попавших в этот интервал. Очередное значение
Числа
называются частотами. Результат этой группировки сводится в таблицу (см. табл. 8.1). Первые три колонки этой таблицы и представляют группированную выборку. Наряду с частотами одновременно подсчитываются и заносятся в таблицу представители интервалов, в качестве которых обычно берут середины интервалов
, относительные частоты
и плотности относительных частот
Для контроля правильности вычислений следует проверить равенства
Статистической (или выборочной) функцией распределения случайной величины по имеющейся выборке называется функция F * (x), равная относительной частоте события
, то есть
, где
число значений в выборке, меньших x; n объём выборки. Гистограммой называется совокупность прямоугольников, основаниями которых служат частичные интервалы, а высоты равны соответствующим плотностям относительных частот. Если середины верхних сторон прямоугольников соединить ломаной линией, то полученная ломанная называется полигоном. Гистограмма и полигон могут служить некоторым приближением графика неизвестной плотности распределения
случайной величины
. Точность приближения возрастает с ростом объема выборки и количества частичных интервалов.
В некоторых случаях строят полигон абсолютных частот, представляющий собой ломаную, отрезки которой соединяют точки где варианты выборки а соответствующие им частоты. Он так же позволяет судить о предполагаемом законе распределения случайной величины Х.
Пример 8.1. Записать в виде вариационного и статистического рядов выборку 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4.
Т а б л и ц а 8.1
Решение. Объем выборки . Упорядочив элементы выборки по величине, получим вариационный ряд 2, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10 . Статистический ряд записывается в виде таблицы
Пример 8.2.Представить выборку из 55 наблюдений в виде группированной выборки, используя 7 интервалов равной длины. Построить гистограмму и полигон. Выборка имеет вид:
17 19 23 18 21 15 16 13 20 18 15 20 14 20 16 14 20 19 15 19 16 19
15 22 21 12 10 21 18 14 14 17 1613 19 18 20 24 16 20 19 17 18 18
21 17 19 17 13 17 11 18 19 19 17 .
Решение. Размах выборки . Длина интервала 14/7=2. Результаты группировки сводим в табл.8.2.
Т а б л и ц а 8.2
Рис. 8.1.Полигон и гистограмма выборки
Пример 8.3.Записать эмпирическую функцию распределения для выборки, представленной статистическим рядом.
Решение.
Задача математической статистики
В задачу математической статистики входят оценки неизвестных параметров распределения:
1.точечные оценкипараметров распределения, например оценка математического ожидания, дисперсии, моментов распределения;
2. интервальные оценки (доверительные интервалы)– интервалы, в которых находятся параметры распределения с доверительной вероятностью;
3. проверка статистических гипотез – проверка предположений о законе распределения генеральной совокупности (ГС; см. ниже) или параметрах распределения;
4. установление формы и степени связи между несколькими случайными переменными.
Перейдем к выполнению этой задачи на основе результатов, полученных в теории вероятностей.