Формування біометричного еталону
Для формування біометричного еталону застосуємо методику розрахунку похибку вимірювань .
Проведемо вимірювання біометричної ознаки А кілька разів. Ми отримаємо не співпадаючі результати: а1, а2, ..., аi, ..., аn, де n - число вимірювань. Різниця між числами ai може бути досить помітна, хоча вимірювання проводяться в однакових умовах, тим же самим методом і одним і тим же дослідником.
Через випадковий характер похибки шукана величина залишається невідомою.
Розрахунок випадкових похибок заснований на теорії ймовірностей і математичній статистиці.
Перш за все, в математичній статистиці доводиться, що за відсутності систематичних похибок (або після їх усунення) найкращим наближенням вимірюваної величини А є так зване середнє статистичне результатів вимірювань
. | (3.3) |
Якщо число n досить велике, то у багатьох отриманих результатів вимірювання аi можуть збігатися всі значущі цифри. Тоді середнє статистичне зручніше підраховувати за такою формулою:
, | (3.4) |
де nk - кількість повторень значення аk в серії з n вимірювань.
Підсумовування відбувається за всіма спостережуваним значенням аk, що розрізняються. Очевидно, що
. | (3.5) |
Наприклад, в експерименті 3 рази було отримано значення вимірюваної величини 2,1; 5 разів - значення 2,3 і 2 рази - значення 2,2. Тоді середнє статистичне можна обчислити так:
а = (3-2,1 + 5-2,3 +2-2,2) / (3 + 5 + 2) = 2,22.
При будь-якому кінцевому числі вимірювань n неможливо гарантувати, що обчислене за формулами (3.3) або (3.4) значення в точності дорівнює шуканій біометричній ознаці А. Справа в тому, що, хоча в кожній конкретній серії вимірювань ми отримуємо n певних чисел аi (і = 1, ... n), самі результати вимірювань за своїм змістом є випадковими. У цьому ми можемо переконатися, повторивши серію з п вимірів. Ми отримаємо вже інші числа ai (і = 1, ... п). Середнє статистичне , що розраховується за формулами (3.3) або (3.4), залежить від усіх аі . У цій ситуації і середнє статистичне також є випадковою величиною. Це твердження можна проілюструвати, повторивши серії з п вимірів кілька разів. Підраховуючи щоразу середнє статистичне за вищенаведеними формулами, ми отримаємо не співпадаючі числові значення для різних серій вимірювань, хоча ці числа будуть групуватися в околиці невідомої величини А. Отже, похибка отриманого результату - різниця (А - ) - також є випадковою величиною.
Одна з важливих теорем математичної статистики стверджує, що при необмеженому збільшенні числа вимірювань п середнє статистичне необмежено наближається до шуканої величини А.
З цього випливає, що підвищити точність результату А можна шляхом збільшення числа вимірів п. Але з іншого боку, неможливо виконати нескінченну кількість вимірів і досягти рівності А = . Тому необхідно отримати кількісне значення похибки (А - ).
Математична статистика пропонує в якості середнього значення випадкової похибки використовувати наступну величину:
. | (3.6) |
Цю величину іноді називають середньоквадратичним відхиленням середнього значення. Число S0 характеризує точність визначення шуканої величини А шляхом обчислення середнього статистичного . Точніше кажучи, S0 є середньою мірою відхилення середнього статистичного від істинного значення А. Однак запис результату вимірювань у вигляді
(3.7) |
призводить до серйозних непорозумінь. Справа в тому, що повторюючи серії з п вимірювань і обчислюючи щоразу нові значення середнього статистичного , ми будемо отримувати числа, що потрапляють всередину інтервалу ( -S0; +S0), так і лежать поза його (причому під тут розуміється середнє статистичне, отримане в першій серії вимірювань). Більш докладне дослідження показує, що випадають з вказаного інтервалу близько третини отриманих значень середнього статистичного в проведених серіях вимірювань. Це природно, оскільки величина S0 є оцінкою середньої, а не максимальної похибки. Величину S0 часто називають середньоквадратичної похибкою наближеної рівності А .
Теорія допускає необмежено велику величину максимальної похибки. У той же час слід взяти до уваги, що дуже великі похибки практично неймовірні, тобто не зустрічаються у вимірах.
Згідно з математичною статистикою, для коректного представлення результату вимірювань слід спочатку задатися його надійністю або, інакше кажучи, довірчою ймовірністю .
Коректне поняття про ймовірність викладається в спеціальній літературі . У цьому розділі поясняється лише процедура обчислення випадкової похибки, відповідної вибраної довірчої ймовірності .
Величина береться такою, щоб додаткова ймовірність (1 - ) була настільки мала, що подія з імовірністю (1 - ) практично не відбувалася б при одноразовому випробуванні. На практиці вели чину довірчої ймовірності вибирається близькою до одиниці, наприклад: 0,9; 0,95; 0,99.
Випадкові похибки прийнято представляти у вигляді довірчого інтервалу, довжина якого визначається величиною довірчої ймовірності. У якості центру довірчого інтервалу для вимірюваної величини А береться її середнє статистичне , обчислене за результатами серії вимірювань А. Межі цього довірчого інтервалу виражаються добутком середньоквадратичного відхилення (3.6) і безрозмірного коефіцієнта Стьюдента .
Величина коефіцієнта Стьюдента залежить від раніше обраної довірчої ймовірності і цілочисельного параметра v, званого числом ступенів свободи. При побудові довірчого інтервалу для вимірюваної величини А число ступенів свободи v береться на одиницю менше кількості вимірів п, проведених в однакових умовах.
Результат вимірювання фізичної величини А представляється у вигляді:
. | (3.8) |
Сенс запису (3.8) такий: вимірювана величина А з імовірністю знаходиться всередині інтервалу ( ; ). Інакше кажучи, побудований інтервал накриває значення невідомої величини А з імовірністю .
Таким чином, повторення серії п вимірювань дасть значення середнього статистичного , яке практично достовірно потрапляє в раніше побудований довірчий інтервал. Практична достовірність забезпечується великою величиною довірчої ймовірності . Ймовірність протилежного результату дорівнює (1 - ), тобто цей результат припускається практично неможливим.
Добуток
(3.9) |
слід розглядати як випадкову погрішність визначення шуканої величини А, але не максимальну, а відповідну надійності . Якщо близька до одиниці, то похибка практично не відрізняється від максимально можливої, яка може реально зустрітися в експериментах.
Можна сказати, що у формулі (3.8) коефіцієнт Стьюдента показує, у скільки разів ймовірна випадкова похибка (яка відповідає обраній довірчій ймовірності) більше середньоквадратичного відхилення S0.