Понятие центра распределения
Координата центра распределения показывает положение случайной величины на числовой оси и может быть найдена несколькими способами. Наиболее фундаментальным является центр симметрии, т.е. нахождение такой точки Хм на оси х, слева и справа от которой вероятности появления различных значений случайной величины одинаковы и равны 0,5:
Точку Хм называют медианой или 50% -ным квантилем. Для ее нахождения у распределения случайной величины должен существовать только нулевой начальный момент.
Можно определить центр распределения как центр тяжести распределения, т.е. такой точки X̅, относительно которой опрокидывающий момент геометрической фигуры, огибающей которой является кривая р(х), равен нулю:
Эта точка называется математическим ожиданием. Следует отметить, что у некоторых распределений, например распределения Коши, не существует МО, так как определяющий его интеграл расходится.
При симметричной кривой р(х) в качестве центра может использоваться абсцисса моды, т.е. максимума распределения Хм. Однако существуют распределения, у которых нет моды, например равномерное. Распределения с одним максимумом называются одномодальными, сдвумя — двухмодалъными и т.д. Те из них, у которых в средней части расположен не максимум, а минимум, называются антимодалъными.
Для двухмодальных распределений применяется оценка цен-'тра в виде центра сгибов:
где xcl, хс2 — сгибы, т.е. абсциссы точек, в которых распределение достигает своих максимумов.
Для ограниченных распределений (равномерного, трапецеидального, арксинусоидального и др.) применяется оценка в виде центра размаха:
где х1, х2 — первый и последний члены вариационного ряда, соответствующего распределению.
Разные оценки центра имеют различную эффективность. При статистической обработке экспериментальных данных важно использовать наиболее эффективную из них, т.е. оценку, имеющую минимальную дисперсию. Это связано с тем, что погрешность в определении Хц влечет за собой неправильную оценку СКО, границ доверительного интервала, эксцесса, контрэксцесса, вида распределения и др., т.е. всех последующих оценок, кроме энтропийных.
В [4] приведен детальный анализ эффективности различных оценок, сделанный с точки зрения затрат времени на проведение измерений. Они, как правило, пропорциональны числу проведенных измерений, поэтому целесообразно сравнивать различные оценки по числу отсчетов п, необходимому для достижения одинаковой дисперсии оценки Хц. Например соотношение дисперсии определения МО и медианы для распределения Лапласа: D[X̅]/D[XM] = 2. Следовательно, определение Хц как Хм в два раза эффективней, чем определение его как X̅, поскольку для достижения одной и той же погрешности измерения требуется в два раза меньший объем выборки исходных данных.
Для островершинных распределений с контрэксцессом к < 0,515 оценка координаты центра медианой Хм эффективнее, чем оценка МО X̅. (Отметим, что для нормального распределения к = 0,577.) Для плосковершинных и двухмодальных распределений эффективность оценки центра как медианы Хм падает до нуля. Оценка центра распределения в виде X̅ безусловно эффективна лишь для одно-модальных распределений, близких к нормальному с контрэксцессом кот 0,515 до 0,645. Для двухмодальных распределений наиболее эффективна оценка центра в виде координаты сгибов Хс, а для ограниченных распределений (равномерного, трапецеидальных, арксинусоидального, кроме треугольного) — в виде центра размаха экспериментальных данных Хр.
При выборе оценки центра распределения помимо ее эффективности необходимо принимать во внимание ее чувствительность к наличию промахов в обрабатываемой совокупности исходных данных. Оценка в виде математического ожидания центра размаха Хр исключительно чувствительна к наличию промахов, так как она определяется по наиболее удаленным от центра наблюдениям, каковыми и являются промахи. Оценка в виде X̅ также слабо защищена от влияния промахов. Оно ослабляется лишь в √n̅ раз, где n — число наблюдений, в то время как его возможный размер ничем не ограничен. Защищенными от влияния промахов являются лишь кван-тильные оценки, т.е. медиана Хм и центр сгибов Хс, поскольку они не зависят от координат промахов.