Вычисление точечных оценок

Занятие № 2

Вычисление статистических оценок

Цели зянятия:

1. Изучить применение встроенных функций MS Excel для получения оценок числовых характеристик случайных величин.

2. Ознакомиться с инструментом Пакета анализа MS Excel «Описательная статистика».

Основные положения

Точечной статистической оценкой параметра a распределения случайной величины называется приближённое значение этого параметра, вычисленное по статиcтическим данным.

Наиболее часто вычисляются следующие оценки: среднее арифметическое выборки (выборочное среднее), выборочная медиана, выборочная дисперсия, выборочные асимметрия и эксцесс.

При оценивании неизвестных параметров наряду с точечными оценками используются также интервальные оценки. Интервальная оценка представляет собой интервал со случайными границами , который с заданной вероятностью γ накрывает неизвестное истинное значение параметра . При этом должно выполняться равенство:

.

Интервал называют доверительным интервалом (интервальной оценкой) для параметра с доверительной вероятностью γ, а и соответственно нижней и верхнейграницами интервальной оценки, а число ε – точностью оценки.

Вычисление точечных оценок

Для выборки объёма n: среднее арифметическое равно

Для сгруппированной выборки , где ─ варианты, ─ частоты, , k ─ число вариант (для интервального статистического ряда ─ середины интервалов, а k ─ число интервалов), выборочное среднее определяется по формуле:

Среднее арифметическое значение является статистической оценкой математического ожидания.

В MS Excel для вычисления выборочного среднего несгруппированной выборки используется функция (категория Статистические): СРЗНАЧ(число1;число2; …), где: число1; число2; … ─ от 1 до 30 аргументов, для которых вычисляется среднее.

Для сгруппированной выборки сначала вычисляют сумму произведений вариант и соответствующих частот с помощью функции: СУММПРОИЗВ(массив1;массив2;…) (категория Математические), а затем делят на объём выборки.

Пример 1. Найти выборочное среднее для выборки из 10 значений: 3; 0; 0; 2; 1; 4; 0; 4; 3; 2.

Последовательность выполнения

1. Ввести исходную выборку в ячейки А2:А11.

2. В ячейку А12 ввести формулу =СРЗНАЧ(А2:А11). В ячейке А12 появится результат: 1,9.

Пример 2. Найти выборочное среднее для выборки, представленной статистическим рядом:

-2 -1

Последовательность выполнения

1. Ввести значения вариант в ячейки С2:С11, а значения соответствующих частот в ячейки D2:D11.

2. В ячейку C12 ввести формулу

=СУММПРОИЗВ(С2:С11;D2:D11)/СУММ(D2:D11).

Функция СУММ() находится в категории Математические. В ячейке С12 появится результат: 3,571429.

Медианой Me называется такое значение признака, которое делит ранжированный ряд на две равные части.

Для дискретного вариационного ряда значение медианы определяется по формуле:

Для интервального статистического ряда сначала определяют номер медианы как полусумму частот . Затем отсчитывают накопленные частоты и находят первый интервал , для которого накопленные частоты не меньше номера медианы . Медиана определяется с помощью интерполяционной формулы:

В MS Excel для вычисления медианы дискретного ряда применяется функция (категория Статистические):

МЕДИАНА(число1;число2; …),

где: число1;число2; … ─ от 1 до 30 аргументов, для которых вычисляется медиана.

Пример 3. Найти медиану дискретного ряда:

1; 0; 6; 2; 4; 4; 1; 3; 4; 5; 6; 7; 2; 5; 4; 1; 2; 0; 0; 6.

Последовательность выполнения

1. Ввести исходную выборку в ячейки А1:А20.

2. В ячейку С1 ввести формулу =МЕДИАНА(А1:А20). В ячейке С1 появится результат: 3,5.

3. Осуществить проверку. Для этого выделить диапазон А1:А20. Выбрать во вкладке Главная на панели Редактирование команды Сортировка и фильтр → Сортировка от минимального к максимальному. Так как число членов ряда чётное, то медиана вычисляется как полусумма десятого и одиннадцатого значений: (3+4)/2 = 3,5.

Пример 4. Найти медиану для интервального статистического ряда, который показывает распределение предприятий региона по численности работников.

№ интервала Число работников Число предприятий
1─10
11─30
31─60
61─100
101─150
151─250
251─500

Последовательность выполнения

1. Ввести данные в диапазоне А1:D9.

2. В ячейку D10 ввести формулу =СУММ(D3:D9)/2.

3. В ячейку E3ввести формулу =D3, а в ячейку E4 ─ формулу =E3+D4.

4. Протянуть ячейку Е4 маркером заполнения до Е9. Медианным интервалом является интервал № 3.

5. В ячейку D11 ввести формулу =B5+(C5-B5)*(D10-E4)/D5.

Появится результат ─ значение медианы: 46,25.

Оценками характеристик рассеивания являются выборочная дисперсия и выборочное среднеквадратическое отклонение.

Выборочная дисперсия для сгруппированной в статистический ряд выборки определяется по формуле:

Исправленная выборочная дисперсия вычисляется по формуле:

Если выборка не сгруппирована, то выборочная дисперсия определяется по формуле:

,

а исправленная выборочная дисперсия ─ по формуле:

.