Выборка. Вариационный ряд. Группированная выборка

УЛЬЯНОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

Методические указания к типовому расчёту по математической статистике

Ульяновск

Математическая статистика: Методические указания к типовому расчёту по курсу «Теория вероятностей и математическая статистика» / Сост. В.Р. Крашенинников, М.Н. Служивый. – Ульяновск: УлГТУ, 2012. – 41 с.

Настоящие методические указания составлены в соответствии с программой курса «Теория вероятностей и математическая статистика» для бакалавриата инженерно–технических специальностей высших учебных заведений. Изложена методика выполнения типового расчёта по математической статистике, дан образец его выполнения и приведены необходимые справочные данные.

Ил. 19. Табл. 11. Библиограф. : 6 назв.

Ó Ульяновский государственный технический университет, 2012

СОДЕРЖАНИЕ

1. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ……………………4

1.1. Введение……………………………………………………………………4

1.2. Выборка. Вариационный ряд. Группированная выборка……………….……………………………………………………5

1.3. Статистическая функция распределения. Гистограмма. Полигон………………………………………………………………….…7

1.4. Оценки математического ожидания и дисперсии……………………...10

1.5. Интервальные оценки………………………………………………..…..12

1.6. Теоретический закон распределения. Метод моментов……...…..…...15

1.7. Критерии согласия……………………………………….………………17

1.8. Линейная среднеквадратическая регрессия………………….………...21

2. ЗАДАНИЕ ТИПОВОГО РАСЧЁТА…….….…………………….………...25

3. КОНТРОЛЬНЫЕ ВОПРОСЫ……………………………… ……………...26

4. ПРИМЕР ВЫПОЛНЕНИЯ ТИПОВОГО РАСЧЁТА…………………….26

ПРИЛОЖЕНИЕ 1. Типовые законы распределения случайных величин.37

ПРИЛОЖЕНИЕ 2. Критические точки распределения…………………...40

ПРИЛОЖЕНИЕ 3. Функция Лапласа …………………...44

СПИСОК ЛИТЕРАТУРЫ……..……………………………………………..46

ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ.

Введение.

Значения многих величин, встречающихся в практической деятельности, зависят от ряда случайных факторов. Поэтом нельзя указать заранее, какое значение примет такая величина, так как оно меняется случайным образом от опыта к опыту. Такие величины называются случайнымии изучаются в теории вероятностей. Например, случайными величинами являются: ёмкость изготовленного конденсатора, диаметр выточенного вала, уровень помех в канале связи и так далее. Случайная величина X полностью определяется в теоретико-вероятностном смысле своей функцией распределения вероятностей:

которая при любом xравна вероятности события X < x. Если F_x(x)известна, то применение методов теории вероятностей позволяет решить ряд задач, связанных с величиной X. В частности, вероятность попадания Xв полуинтервал [a, b)может быть найдена по формуле:

P(a < X < b) = F_x(b) – F_x(a).

Таким образом, возникает задача нахождения функции распределения исследуемой случайной величины X.Иногда F_x(x) может быть найдена чистотеоретически из анализа природы величины X, но такие случаи относительно редки. В данных методических указаниях будет рассмотрена одна из основных задач математической статистики – нахождение F_x(x)по результатам наблюдений случайных величин.

Для описания многих явлений оказывается недостаточно одного параметра, поэтому приходится рассматривать два и более параметров и исследовать соотношения между ними. В некоторых случаях эти соотношения можно считать в определённых пределах точными, например, законы Ньютона, Ома и так далее. В других случаях такой определённости нет, например, точной зависимости между ростом и весом человека. Однако наблюдается приблизительная зависимость: «в среднем, с увеличением роста X увеличивается и вес Y», что может быть описано приближённой формулой:

y = ax + b.

Константы aи bпри этом нужно подобрать так, чтобы приведённое выражение описывало как можно точнее связь между случайными величинами X и Y.

Таким образом, возникает ещё одна задача математической статистики – нахождение приблизительных, выполняющихся «в среднем», связей между случайными величинами. В данных методических указаниях будет рассмотрена задача определения, по результатам наблюдений величин X и Y, «наилучших»значенийaиbв формулеy = ax + b.

Выборка. Вариационный ряд. Группированная выборка.

Предположим, что исследуется некоторое явление, описываемое двумя количественными признаками XиY, которые буем считать случайными величинами. Требуется на основании ряда наблюдений охарактеризовать XиY, а также оценить связь между ними.

Статистическое исследование начинается со сбора данных. Для этого производится nопытов (наблюдений), результаты которых регистрируются. Если (x_i , y_i)– значения XиY, полученные в i–м опыте, то получаем последовательность:

(x₁, y₁) , (x₂, y₂) , …... , (x_n , y_n),(1.1)

называемую выборкой. Число опытов nназывается объёмом выборки. Выборка является исходным материалом для всех дальнейших статистических выводов о случайных величинах Xи Y.

Для начала будем исследовать X иYпо отдельности, поэтому сформируем из совместной выборки (1.1) две выборки для X и Y раздельно:

x₁, x₂, … , x_n ,(1.2)

y₁ , y₂, … , y_n ,(1.3)

На этом этапе обе выборки будут обрабатываться совершенно одинаково, поэтому рассмотрим только случайную величину Xи её выборку (1.2).

Если элементы выборки (1.2) записать в порядке их возрастания, то полученная последовательность будет называться вариационным рядом. Вариационный ряд значительно удобнее для дальнейшей обработки, чем неупорядоченная (простая) выборка (1.2).

При большом объёме nпростая выборка и вариационный ряд становятся очень громоздкими и мало наглядными. Для придания им большей наглядности и компактности производится группировка данных. Для этого весь интервал значений выборки разбивают на k частичных интервалов или разрядов и подсчитывают число m_i значений выборки, попавших в каждый i–й разряд . Значение x_gотносится к i– му интервалу, если . Числа m_iназываются частотами. Результат этой группировки сводится в таблицу 1, называемую группированной выборкой.Первые три колонки этой таблицы и представляют нашу группированную выборку. В дальнейшем нам также понадобятся представители интервалов , то есть средние точки интервалов, относительные частоты и плотности относительных частот . Для контроля правильности вычислений следует проверить равенства:

; .

Относительная частота равна доле элементов выборки, попавших в i–й интервал, поэтому числа дают более наглядное представление о выборке, чем частоты m_i .

При всех своих положительных качествах, группированная выборка является некоторым огрублением статистического материала, так как известно только, что m_i значений выборки находятся между a_i и a_i₊₁ , точные же значения становятся неизвестными. Поэтому и вводится представитель интервала z _i , который принимается за « среднее » значение элементов выборки из этого интервала.

Для того, чтобы огрубление не было слишком сильным, нужно стремиться делать частичные интервалы как можно короче, то есть увеличивать их количество. При этом следует соблюдать меру, так как при большом числе интервалов и группированная выборка сможет стать слишком громоздкой. Как правило, более 20 интервалов не используется. При объёме выборки порядка 100следует взять 8– 10интервалов.

Таблица 1. Группированная выборка.

Номер интервала	Границы интервала (a_i; a_i+1)	Частотa m _i	Представитель интервала z _i	Относительная частота	Плотность относительной частоты
	( a₁; a₂)	m ₁	z ₁
……………	……………	……………	……………	……………	……………
K	( a_k ; a_k+1 )	m _k	z _k

Замечание. При подсчёте частот m_iследует учитывать способ получения выборки. Пусть, например, производится округление до ближайшего деления в одну сотую, тогда элемент выборки x_g = 6,50должен восприниматься как число от 6,495 до 6,505. Если при этом 6,50является границей интервалов, то становится неясным, к какому из двух соседних интервалов отнести x_g = 6,50. Учитывая, что шансы попасть в любой из этих двух интервалов, равны, общее число r значений выборки, равных 6,50, делят между интервалами поровну (если rнечётно, то в какой-нибудь интервал относят на одно значение больше). Если же округление производится до сотых путём отбрасывания остальных значащих цифр, то x_g = 6,50должно восприниматься как число от 6,50до 6,51с соответствующими выводами при подсчёте частот.