Выборочные числовые характеристики

Оглавление

ВВЕДЕНИЕ.. 3

1. ЗАДАНИЕ И ИСХОДНЫЕ ДАННЫЕ.. 4

1.1. Содержание задания. 4

1.2. Исходные данные. 5

2. ВЫПОЛНЕНИЕ ЗАДАНИЙ.. 6

2.1. Задание №1. 6

2.1.1. Гистограмма распределения. 6

2.1.2. Выборочные числовые характеристики. 8

2.1.3. Метод максимального правдоподобия. 8

2.1.5. Критерий Пирсона. 11

2.2. Задание №2. 13

2.2.1. Гистограмма выборки. 15

2.2.2. Выборочные числовые характеристики. 16

2.2.3. Метод моментов. 17

2.2.4. Доверительные интервалы.. 17

2.2.5. Критерий Пирсона. 18

2.3. Задание №3. 19

2.3.1. Выборочные числовые характеристики. 19

2.3.2. Гипотеза о независимости. 20

2.3.3. Уравнения регрессии. 21

Список литературы... 22

ПРИЛОЖЕНИЕ А. Задание №1. 23

ПРИЛОЖЕНИЕ Б. Задание №2. 27

ПРИЛОЖЕНИЕ В. Задание №3. 31

 

 


ВВЕДЕНИЕ

Математическая статистика — наука о математических методах анализа данных, полученных при проведении массовых наблюдений (измерений, опытов).

Один из основателей математики случайностей Блез Паскаль определили ее как «учение, объединяющее точность математических доказательств с неопределенностью случая и примиряющее эти, казалось бы, противоречивые элементы».

Математическая статистика изучает методы (в рамках точных математических моделей), которые позволяют отвечать на вопрос, соответствует ли практика, представленная в виде результатов эксперимента, данному гипотетическому представлению о природе явления или нет. При этом имеются в виду не эксперименты, которые позволяют делать однозначные, детерминированные выводы о рассматриваемых явлениях, а эксперименты, результатами которых являются случайные события. С развитием науки задач такого рода становится все больше и больше, поскольку с увеличением точности экспериментов становится все труднее избежать «случайного фактора», связанного с различными помехами и ограниченностью наших измерительных и вычислительных возможностей. Вот почему за последнее время статистические методы, проникнув в самые разнообразные области науки и техники, стали широко использоваться при анализе и обработке опытных данных.

В зависимости от математической природы конкретных результатов наблюдений математическая статистика делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы. Существенная часть математической статистики основана на вероятностных моделях. Выделяют общие задачи описания данных, оценивания и проверки гипотез. Рассматривают и более частные задачи, связанные с проведением выборочных обследований, восстановлением зависимостей, построением и использованием классификаций (типологий) и др.

 


ЗАДАНИЕ И ИСХОДНЫЕ ДАННЫЕ

Содержание задания

1. Смоделировать случайную величину , имеющую нормальный закон распределения с параметрами . На основе выборки объема исследовать статистические характеристики случайной величины , решив следующие задачи.

1.1. Построить гистограмму распределения и изобразить ее графически одновременно с теоретической плотностью вероятностей.

1.2. Вычислить выборочное среднее и выборочную дисперсию.

1.3. Найти оценки математического ожидания и дисперсии методом максимального правдоподобия. Указать несмещенную оценку дисперсии.

1.4. Построить доверительные интервалы для математического ожидания и дисперсии, соответствующие доверительной вероятности .

1.5. Проверить гипотезу о нормальном распределении случайной величины , используя критерий Пирсона при уровне значимости .

2. Смоделировать случайную величину X, имеющую заданный непрерывный закон распределения (отличный от нормального) с заданными параметрами. На основе выборки объема исследовать статистические характеристики случайной величины X, решив следующие задачи.

2.1. Построить гистограмму распределения и изобразить ее графически одновременно с теоретической плотностью вероятностей.

2.2. Определить точечные оценки математического ожидания и дисперсии.

2.3. При заданном виде распределения построить оценки входящих в него неизвестных параметров методом моментов.

2.4. Построить доверительные интервалы для математического ожидания и дисперсии, соответствующие доверительной вероятности .

2.5. Проверить гипотезу о виде распределении случайной величины X, используя критерий Пирсона при уровне значимости .

3. Смоделировать случайный вектор , имеющий двумерный нормальный закон распределения с параметрами . На основе выборки объема исследовать статистические характеристики случайного вектора , решив следующие задачи.

3.1. Найти точечные оценки параметров, входящих в распределение.

3.2. Проверить гипотезу о независимости случайных величин и при уровне значимости .

3.3. Найти эмпирические уравнения регрессии на и на и изобразить их графически одновременно с выборочными значениями.


Исходные данные

Группа 628

Вариант 21

Задача №1

n a s2 g a
0.25 10.7 0.999 0.001

 

Задача №2

 

Исходные данные: a = 2, b = -4, a = 0.05, g = 0.95, n = 400.

Рассчитать аналитически: MX, DX, F(x), .

Найти точечные оценки параметров a и b методом моментов.

 

Задача №3

Значения параметров заимствовать из задачи 1.

-3.7 5.0 0.46

 


ВЫПОЛНЕНИЕ ЗАДАНИЙ

Задание №1.

Гистограмма распределения

Наблюдаем случайную величину X, которая имеет нормальный закон распределения с заданными параметрами a и 2, т.е. . Это значит, что плотность вероятностей случайной величины X определяется по формуле .

Смоделируем эту случайную величину на компьютере. В процессе работы будем использовать свободный универсальный математический пакет SciLab v.5.3.3.

В этом пакете имеется функция rand, моделирующая равномерное распределение . С ее помощью можно смоделировать нормальное распределение, воспользовавшись формулами

,

,

где - числа, получаемые вызовом функции rand;

- выборка, соответствующая распределению, близкому к ,

- выборка, соответствующая распределению, близкому к .

Теперь по полученной выборке требуется построить гистограмму распределения.

Сначала найдём выборочные максимум и минимум:

Простым вызовом соответствующих функций в Scilab получаем:
xmin= -9.599971

xmax= 7.8887969

 

Количество интервалов группировки определяется по правилу Стургерса: . (Для вычисления десятичного логарифма используем функцию log10, для взятия целой части от числа - floor)

Ширину интервалов группировки легко определить: .

Таким образом, получаем k = 10, =1.7488768.


 

Полученные данные занесём в следующую таблицу:

Номер интервала Интервал
[-9.599971; -7.8510942) 0.0063158 0.0036113 0.0028270
[-7.8510942; -6.1022174) 0.0231579 0.0132416 0.0106259
[-6.1022174; -4.3533406) 0.0589474 0.0337058 0.0300104
[-4.3533406; - 2.6044638) 0.1305263 0.0746344 0.0636846
[- 2.6044638;- 0.8555870) 0.1642105 0.0938949 0.1015442
[- 0.8555870; 0.8932898) 0.2021053 0.1155629 0.1216561
[0.8932898; 2.6421666) 0.1852632 0.1059327 0.1095143
[2.6421666; 4.3910434) 0.1347368 0.0770419 0.0740739
[4.3910434; 6.1399202 ] 0.0568421 0.0325021 0.0376459
[6.1399202; 7.8887969 ] 0.0378947 0.0216680 0.0143757
     

Здесь – границы интервалов группировки;

– частоты значений;

– относительные частоты;

– высоты гистограммы;

– теоретические значения плотности вероятностей в серединах интервалов. Отметим, что .

Теперь одновременно изображаем гистограмму распределения и теоретическую плотность вероятности.

Для этого воспользуемся функциями plot2d и hisplot.

Выборочные числовые характеристики

У нас имеется выборка объёма n , полученная при n наблюдениях за случайной величиной X. Требуется определить выборочные числовые характеристики по этой выборке.

Аналогом математического ожидания является выборочное среднее. Оно определяется как среднее арифметическое элементов выборки: . В Scilab для этого предусмотрена функция mean.

Аналогом дисперсии является выборочная дисперсия. Она определяется следующим образом: . Здесь .

Для нашего случая получаем:

x=0.1515287

s2=10.70955

Отклонения от реальных значений составляют:

| a-x | = 0.0984713

| 2-s2|=0.0095504