Определение координаты центра распределения

Координата центра распределения определяет положение случайной величины на числовой оси и может быть найдена несколькими способами. Наиболее фундаментальным /6, 23/ является отыскание центра по принципу симметрии, т. е. такой точки на оси , слева и справа от которой вероятности появления различных значений случайной величины одинаковы и равны 0,5. В этом случае для интегральной функции распределения вероятностей должно выполняться условие:

 

  . (2.2)

 

При этом точку называют медианой или 50 %-ной квантилью. Для его нахождения у распределения случайной величины должен существовать только нулевой начальный момент. Нулевым моментом в математической статистике /23/ называют некоторое среднее значение, отсчитываемое от начала координат. Нулевой начальный момент равен единице. Он используется для задания условия нормирования плотности распределения и определяется по формуле:

 

  . (2.3)

 

Первым начальным моментом, как известно, /23/ является математическое ожидание случайной величины.

В качестве оценки центра распределения может выбираться одна из следующих оценок (в зависимости от типа распределения): выборочное среднее арифметическое, медиана, центр размаха, срединный размах.

При выборе оценок центра распределения следует учитывать, что они имеют различную чувствительность к наличию промахов в обрабатываемой совокупности исходных данных.

 

2.1.1.1 Определение выборочного среднего арифметического

 

Его определяют по формуле:

 

  , (2.4)

 

где – отдельные результаты наблюдений;

n – общее количество результатов.

Выборочное среднее арифметическое для упорядоченной совокупности (вариационного ряда) вычисляется по формуле:

 

  , (2.5)

 

где m – частота повтора отдельных результатов наблюдений;

– частость (статистическая вероятность) попадания i-го наблюдения в определенный k-й интервал.

Выборочное среднее арифметическое является несмещенной оценкой любого закона распределения, кроме этого – состоятельной, эффективной и достаточной (характеристика полноты использования всей содержащейся в выборке информации) /1/.

Однако оценка в виде среднего арифметического слабо защищена от влияния промахов. Она ослабляется лишь в раз, где – число наблюдений, в то время как его возможный размер не ограничен.

 

2.1.1.2 Среднее арифметическое 90 %-ной выборки

 

Среднее арифметическое (по ограниченному числу наблюдений) находится по формуле:

 

  , (2.6)

 

где для случая, когда с каждого конца вариационного ряда исключают по t значений для получения более устойчивой оценки центра распределения. Обычно используют значения и (это означает, что следует отбрасывать по 5 или 10 % результатов наблюдений).

В метрологии чаще находит применение среднее арифметическое 90 %-ной выборки (обозначаемой символами или ). Она определяется по формуле:

 

  , (2.7)

 

где – число не учитываемых результатов.

Среднее арифметическое также может быть определено:

 

  , (2.8)

 

где – частота попадания i-го значения в k-й интервал (при интервальном представлении вариационного ряда).

Оценка менее чувствительна к результатам с грубыми погрешностями, чем выборочное среднее арифметическое ; поскольку при обработке 90 % объема выборки отбрасываются из концов вариационного ряда по 5 % наиболее удаленных результатов, в которых могут содержаться грубые погрешности.

 

2.1.1.3 Медиана наблюдений

Медианой называют наблюдаемое значение (так называемую варианту), которая делит вариационный ряд на две части, равные по числу вариант.

Медиана вычисляется по нижеприведённым формулам.

 

Если – четное, то медиана рассчитывается по формуле:

 

  , (2.9)

 

Если – нечетное, то по формуле:

 

  , (2.10)

Следует иметь в виду, что медиана является наиболее эффективной оценкой для симметричных экспоненциальных распределений, в которых контрэксцесс принадлежит интервалу . Для класса распределений, близких к нормальному, с эффективными оценками являются среднее арифметическое , занимающие медианное положение.

Для распределений, близких к равномерному и арксинусоидальному, с целесообразно использовать центр размаха . Для двухмодальных распределений с центр срединного размаха .

Медиана является эффективной оценкой центра экспоненциальных пологоспадающих одномодальных распределений Лапласа с эксцессом .