Знаходження об’єму вибірки

Статистичні оцінки параметрів розподілу: точкові та інтервальні оцінки

1. Точкові оцінки

Точковою називають статистичну оцінку, яка визначається одним числом.

Незміщеною називають точкову оцінку, математичне сподівання якої дорівнює оцінюваному параметру при будь-якому об’ємі вибірки. Незміщеною оцінкою генеральної середньої (математичного сподівання) є

вибіркова середня: , де

– варіанта вибірки; –частота варіанти ; – об’єм вибірки.

Зміщеною оцінкою генеральної дисперсії євибіркова дисперсія:

Більш зручна формула:

Незміщеною оцінкою генеральної дисперсії євиправлена вибіркова дисперсія:

Вибірковим середньоквадратичним відхиленням називають квадратний корінь з вибіркової дисперсії: Виправленим середньоквадратичним відхиленням буде

Зауваження. Якщо початкові варіанти – великі числа, то для спрощення обрахунків потрібно відняти від кожної варіанти одне і те ж число С, тобто потрібно перейти до умовних варіант: . Тоді: , ,

За С вигідно брати число, близьке до вибіркової середньої.

Для порівняння оцінок варіацій статистичних рядів із різними значеннями , які не дорівнюють нулеві, вводиться коефіцієнт варіації, який обчислюється за формулою:

Медіаною називається варіанта, яка є серединою статистичного варіаційного ряду .

Модою статистичного розподілу називається варіанта, яка має найбільшу частоту.

2. Інтервальні оцінки

Інтервальною називають оцінку, яка визначається двома числами – кінцями інтервалу, який покриває оцінюваний параметр. Довірчим називають інтервал, який із заданою надійністю g покриває оцінюваний параметр.

1) Для оцінки математичного сподіванняa нормально розподіленої кількісної оцінки x по вибірковій середній , коли відоме середньоквадратичне відхилення d генеральної сукупності, використовується довірчий інтервал: , де n – об’єм вибірки;

точність оцінки; t – значення аргументу функції Лапласа , при якому .

 

2) Якщо d невідоме і об’єм вибірки n>30, то використовується довірчий інтервал:

, де S – виправлене середньоквадратичне відхилення;

3) Для оцінки середньоквадратичного відхилення d нормально розподіленої кількісної ознаки c з надійністю g за виправленим вибірковим середньоквадратичним відхиленням S використовуються довірчі інтервали: (якщо q<1)

(якщо q>1).

Знаходження об’єму вибірки

Нехай ознака Х генеральної сукупності розподілена за нормальним законом з параметром s і треба знайти об’єм вибірки n, який із заданою точністю d та надійністю g дозволить знайти оцінку параметра a. Тоді


Розв’язок типових задач

За даним статистичним розподілом вибірки:

2,5 4,5 6,5 8,5 10,5

1. Обчислити незміщену оцінку генеральної середньої.

2. Знайти дисперсію та виправлену дисперсію.

3. Обчислити середнє квадратичне відхилення та виправлене середньоквадратичне відхилення.

4. Знайти розмах варіації та коефіцієнт варіації.

Розв’язання. Незміщеною оцінкою генеральної середньої є вибіркова середня. Оскільки , то:

1. Для обчислення вибіркової дисперсії визначимо:

 

Тоді:

2. Виправлена дисперсія матиме вигляд:

3. Знайдемо середньоквадратичне відхилення:

Тоді виправленим середньоквадратичним відхиленням буде:

4. – розмах варіації.

– коефіцієнт варіації.

Приклад. Знайти довірчий інтервал для оцінки з надійністю 0,95 невідомого математичного сподівання a нормально розподіленої ознаки х генеральної сукупності, якщо дано генеральне середнє квадратичне відхилення s=5, вибіркова середня = 14, об’єм вибірки n = 25.

Розв’язок. Потрібно знайти довірчий інтервал .

Знайдемо t із співвідношення , маємо Ф(t) = =0,475.

За таблицею (додаток) знаходимо t = 1,96.

Підставивши t = 1,96, = 14, s = 5, n=25 в формулу, отримаємо шуканий довірчий інтервал: 12,04<а<15,96.

Приклад.Знайти мінімальний об’єм вибірки, при якому з надійністю 0,975 точність оцінки математичного сподівання a генеральної сукупності за вибірковою середньою буде дорівнювати d = 0,3, якщо відомо середнє квадратичне відхилення s = 1,2 нормально розподіленої генеральної сукупності.

Розв’язок

.

За умовою g = 0,975, . Тоді Ф(t) = 0,4875.

За таблицею знайдемо t = 2,24.

Підставивши t = 2,24, s = 1,2 і d = 0,2 у формулу, отримаємо шуканий об’єм вибірки n = 81.

Розв’язок типових задач

Приклад. Знайти довірчий інтервал для оцінки з надійністю 0,95 невідомого математичного сподівання a нормально розподіленої ознаки х генеральної сукупності, якщо дано генеральне середнє квадратичне відхилення s=5, вибіркова середня = 14, об’єм вибірки n = 25.

Розв’язок. Потрібно знайти довірчий інтервал .

Знайдемо t із співвідношення , маємо Ф(t) = =0,475.

За таблицею (додаток) знаходимо t = 1,96.

Підставивши t = 1,96, = 14, s = 5, n=25 в формулу, отримаємо шуканий довірчий інтервал: 12,04<а<15,96.

Приклад.Знайти мінімальний об’єм вибірки, при якому з надійністю 0,975 точність оцінки математичного сподівання a генеральної сукупності за вибірковою середньою буде дорівнювати d = 0,3, якщо відомо середнє квадратичне відхилення s = 1,2 нормально розподіленої генеральної сукупності.

Розв’язок. Скористаємося формулою, яка визначає точність оцінки математичного сподівання генеральної сукупності за вибірковою середньою: .

Звідси: .

За умовою g = 0,975, . Тоді Ф(t) = 0,4875.

За таблицею знайдемо t = 2,24.

Підставивши t = 2,24, s = 1,2 і d = 0,2 у формулу, отримаємо шуканий об’єм вибірки n = 81.

 


Статистичні оцінки параметрів розподілу: точкові та інтервальні оцінки +

 

Точкові оцінки

Точковою називають статистичну оцінку, яка визначається одним числом.

Незміщеною називають точкову оцінку, математичне сподівання якої дорівнює оцінюваному параметру при будь-якому об’ємі вибірки.

Незміщеною оцінкою генеральної середньої (математичного сподівання) є вибіркова середня: , де – варіанта вибірки;

– частота варіанти ; – об’єм вибірки.

Зауваження 1. Якщо початкові варіанти – великі числа, то для спрощення обрахунків потрібно відняти від кожної варіанти одне і те ж число С, тобто потрібно перейти до умовних варіант: . Тоді:

.

За С вигідно брати число, близьке до вибіркової середньої.

Зміщеною оцінкою генеральної дисперсії є вибіркова середня:

Більш зручна формула:

Зауваження 2. Якщо и – великі числа, то (дисперсія при цьому не зміниться):

Зауваження 3. Якщо початкові варіанти є десятковими дробами з k десятковими знаками після коми, то потрібно перейти до умовних варіант: . Тоді:

.

Незміщеною оцінкою генеральної дисперсії є виправлена вибіркова дисперсія:

Якщо , то якщо , то

Вибірковим середньоквадратичним відхиленням називають квадратний корінь з вибіркової дисперсії:

Виправленим середньоквадратичним відхиленням буде

Розмахом варіації називають різницю між найбільшою та найменшою варіантами

Для порівняння оцінок варіацій статистичних рядів із різними значеннями , які не дорівнюють нулеві, вводиться коефіцієнт варіації, який обчислюється за формулою:

 

Розв’язок типових задач

Приклад. За даним статистичним розподілом вибірки:

2,5 4,5 6,5 8,5 10,5
  1. Обчислити незміщену оцінку генеральної середньої.
  2. Знайти дисперсію та виправлену дисперсію.
  3. Обчислити середнє квадратичне відхилення та виправлене середньоквадратичне відхилення.
  4. Знайти розмах варіації та коефіцієнт варіації.

Розв’язання. Незміщеною оцінкою генеральної середньої є вибіркова середня. Оскільки , то:

1. Для обчислення вибіркової дисперсії визначимо:

 

Тоді:

2. Виправлена дисперсія матиме вигляд:

3. Знайдемо середньоквадратичне відхилення:

Тоді виправленим середньоквадратичним відхиленням буде:

4. – розмах варіації.

– коефіцієнт варіації.

Інтервальні оцінки

Інтервальною називають оцінку, яка визначається двома числами – кінцями інтервалу, який покриває оцінюваний параметр.

Довірчим називають інтервал, який із заданою надійністю g покриває оцінюваний параметр.

1) Для оцінки математичного сподіванняa нормально розподіленої кількісної оцінки x по вибірковій середній , коли відоме середньоквадратичне відхилення d генеральної сукупності, використовується довірчий інтервал:

, де точність оцінки;

n – об’єм вибірки;

t – значення аргументу функції Лапласа , при якому ; (див. у додатку).

2) Якщо d невідоме і об’єм вибірки n>30, то використовується довірчий інтервал:

,

де S – виправлене середньоквадратичне відхилення;

t – знаходять за таблицями (в додатку A), яке дорівнює .

3) Для оцінки середньоквадратичного відхилення d нормально розподіленої кількісної ознаки c з надійністю g за виправленим вибірковим середньоквадратичним відхиленням S використовуються довірчі інтервали:

(якщо q<1)

(якщо q>1).