Помилки спостереження і контроль вірогідності даних

Точність - це міра відповідності даних спостережень дійсній їх величині.

Вірогідність - це міра об'єктивного відображення статистичними даними суті явищ і процесів.

Помилка спостереження - це розбіжність між даними спостереження і дійсним значенням показника. Помилки бувають помилками реєстрації та репрезентативності.

Помилки реєстрації виникають внаслідок неправильного встановлення фактів чи неправильного запису. Допускаються випадково або систематично. Випадкові виникають внаслідок дії випадкових причин і спричиняють спотворення даних, допускаються респондентами і реєстраторами. Вони не є небезпечними і, як правило, урівноважуються. Систематичні приводять до зміщень узагальнених даних. Іноді виникають через нечітке формулювання програми спостереження. Бувають помилки навмисні і ненавмисні. Систематичні навмисні помилки реєстрації виникають внаслідок свідомого викривлення фактів. Винні службові особи притягаються до дисциплінарної, матеріальної і, навіть, кримінальної відповідальності.

Помилки репрезентативності виникають при несуцільному спостереженні, коли відібрана та обстежена частин сукупності, що не повністю відтворює склад сукупності в цілому.

Помилки спостереження виявляються при ретельній перевірці і контролі вірогідності даних, що зокрема передбачають:

1. Перевірку правильності оформлення первинних документів.

2. Логічний контроль.

3. Арифметичний контроль, який полягає у перевірці узагальнюючих показників.

Тема 3. СТАТИСТИЧНІ ЗВЕДЕННЯ І ГРУПУВАННЯ

Важливим етапом статистичного спостереження є систематизація і групування інформації.

Статистичне зведення - це упорядкування, систематизація і наукова обробка статистичних даних.

Завдання зведення - підрахувати, узагальнити матеріали спостереження для того, щоб визначити характерні риси та істотні відмінності явищ, процесів, виявити закономірності їх розвитку. За організацією робіт розрізняють централізоване та децентралізоване зведення.

Зведення може бути:

Ø Просте зведення - це простий підрахунок, підсумки первинного статистичного матеріалу.

Ø Складне зведення передбачає: 1)групування; 2)вибір групувальних ознак; 3)визначення меж групування; 4)підрахунок групових і загальних підсумків; 5)викладення результатів у вигляді статистичних таблиць і графіків.

Групування полягає у розподілі сукупності на групи за істотними для них ознаками. Вимоги до групування:

1) всебічний глибокий аналіз сутності явища;

2) чітке визначення істотних ознак;

3) обґрунтоване визначення інтервалів групування, щоб в утворені групи збирались подібні одиниці, а окремі групи істотно відрізнялись одна від одної.

Групування може здійснюватись за якісною чи кількісною ознакою. Якісні (атрибутивні) ознаки характеризують стан явища і не можуть бути виражені числом. Альтернативна ознака є окремим видом атрибутивної ознаки і може набувати двох значень (наприклад, здав – не здав). Кількісні ознаки за характером варіації поділяються на дискретні та неперервні.

Основні завдання групування:

1) розклад сукупності на якісно однорідні підгрупи;

2) дослідження структури сукупності і структурних зрушень;

3) аналіз зв'язків між змінними ознаками.

Види групування:

1) типологічне – складна сукупність, яка містить неоднорідні одиниці розкладається на ряд якісно-однорідно однорідних груп за типологічною ознакою;

2) структурне – використовується для характеристики співвідношення між окремими частинами якісно-однорідної сукупності;

3) аналітичне – служить для дослідження взаємозв'язку між факторними незалежними та резервною залежною ознаками.

Для групування за кількісною ознакою необхідно встановити число відокремлених груп і розміри інтервалу. Інтервали можуть бути:

1) однакові і неоднакові;

2) відкриті і закриті.

Число утворених груп при аналітичному групуванні орієнтовно визначають за формулою Стерджерса

(3.1)

Ряд розподілу

Ряд статистичних даних, які отримано в результаті їх зведення і групування за певною змінною кількісною чи якісною ознакою, називається ряд розподілу. Кожен елемент ряду характеризується двома величинами варіантою та частотою (іноді частота виражається у відносних величинах і називається відносною).

Варіанта – це унікальне характерне значення групувальної ознаки.

Частота – це число, яке показує як часто варіанта зустрічається у ряді.

Густина розподілу – це частота, яка припадає на одиницю довжини інтервалу, і використовується для рядів з неоднаковими інтервалами.

Нагромаджена частота – це частота, яка вказує для скількох величин сукупності значення ознаки не перевищує відповідну варіанту.

Класифікація рядів розподілу наведена на рис. 1.

Тема 4. СТАТИСТИЧНІ ПОКАЗНИКИ