Ранжирование выборочных данных и вычисление моды и медианы.

 

Проранжируем исходный ряд статистических данных, т.е. расположим выборочные данные в порядке возрастания. В ранжированном вариационном ряду все элементы выборки упорядочены в виде неубывающей последовательности значений случайной величины Х.

Ранжированный ряд необходим для построения интервального вариационного ряда, поскольку объем выборки достаточно велик.(таблица 1.)

Интервал [4,03; 8,29] содержит все элементы заданной выборки. Разбиваем на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов. По формуле Стерджеса длина частичного интерваларавна:

где, и - соответственно максимальное и минимальное значения выборки.

k = – число интервалов, которое округляется до ближайшего целого числа.

Округляем до h=0,6 и вычисляем последовательно границы частичных интервалов. За начало первого интервала принимаем значение:

Далее вычисляем границы интервалов (начало второго интервала совпадает с концом первого и т.д.):

Заканчиваем вычисление границ, как только выполниться неравенство

Далее определяем частоты – количество ni элементов выборки, попавших в i-й энтервал (ni равно числу членов вариационного ряда, для которых справедливо неравенство xi-1 xi* <xi, где xi-1, xi – границы i-го интервала; xi* - значения вариационного ряда).

По результатам вычислений составляем таблицу частот группированной выборки (таблица 2). В первой строке таблицы определим частичные интервалы, во второй строке – середины интервалов, в третьей строке запишем количество элементов выборки, попавших в каждый интервал – частоты; в четвертой – относительные частоты и в пятой – значения плотности относительных частот (значения выборочной, эксперементальной функции плотности)

Таблица 2.

Значения выборочной плотности распределения

h [3,73;4,33) [4,33;4,93) [4,93;5,53) [5,53;6,13) [6,13;6,73) [6,73;7,33) [7,33;7,93) [7,93;8,53)
4.03 4.36 5.23 5.83 6.43 7.03 7.63 8.23
0.017 0.100 0.217 0.167 0.283 0.133 0.050 0.033
0.028 0.167 0.361 0.278 0.472 0.222 0.083 0.056

 

Посчитаем относительное количество наблюдений попавших в данный интервал, а также плотность распределения относительных частот , если длина h промежутков достаточно мала и объем выборки N велик (как в данном случае), то с вероятностью, близкой к единице, можно утверждать, что

Иными словами функция является статистическим аналогом плотности распределения наблюдаемой в эксперименте случайной величины Х. плотность распределения относительных частот служит одной из основных характеристик интервального вариационного ряда.

Для наглядного представления о закономерностях изменения вариационного ряда построим график «гистограмма и полигон относительных частот». Для этого выбеем систему координат и по оси абсцисс отложим частичные интервалы [Xi-1, Xi) и середины этих интервалов , а по оси ординат – относительные частоты и плотность относительных частот.

 

Анализируя вычисления в таблице 2, можно сделать вывод, что мода (наиболее часто встречающееся значение) экспериментального распределения имеет одно значение – локальный максимум в окрестности точки с частотой n=17.

Используя вариационный ряд, находим оценку медианы (значение признака, который делит ряд пополам) по формуле:

Сравним оценки медианы и математического ожидания Х=6,35. Сравнение показывает, что они отличаются на 1,23%