Відбір ознак зображення облич

Вибір і виділення ознак грають в розпізнаванні образів ключову роль.

2.3.1 Категорії ознак зображення облич

 

Є три категорії ознак: фізичні, структурні і математичні.

Фізичні та структурні ознаки виражаються через форми обличчя (овал обличчя, геометрія його основних частин), його колір, а також колір волосся і т.д. Найбільш часто використовуваний ознака - яскравість. До фізичних та структурним ознаками можна віднести також координати точок обличчя в місцях, відповідних зміні контрасту (брови, очі, ніс, вуха, рот і овал).

До математичним ознак належать спектри вихідних образів, статистичні характеристики, градієнти зміни яскравості та інші, отримані в результаті математичного перетворення вихідних ознак.

 

2.3.2 Способи виділення ознак зображення облич

Способи виділення різняться, залежно від використовуваного способу представлення і способу його редукції .

Яскравості ознаки збираються в вектор простим перерахуванням значень яскравості кожного пікселя. Для образу 112х92 пікселя виходить матриця порядку 10304. У такому просторі пошук практично неможливий, тому зображення попередньо зменшується до прийнятних розмірів.

У другому способі вихідний образ розглядається як набір стовпців і рядків, які є самостійними векторами ознак. Процедура перетворення застосовується окремо для рядків і окремо для стовпців. В результаті виходить матриця, що має значно менший порядок. Крім того, це підвищує і точність розпізнавання (до 85%), збільшує стійкість до зміни яскравості, циклічного зсуву і шумів.

Для ще більшої редукції ознак можна застосувати далі лінійний дискримінантний аналіз. В результаті, розпізнавання доходить до 100% у великих базах даних.

Серед математичних ознак найчастіше використовуються спектральні ознаки, отримані в результаті перетворення Фур'є. Розмір початкового простору ознак може скласти до 200 елементів. При цьому для більш високого рівня розпізнавання перетворення Фур'є застосовуються не для усередненого образу, а для кожного окремо.

Інший спосіб - сканування образу почергово кожної з 25 масок 3х3, 5х5 і т.д. пікселів і складання 25-компонентного вектора ознак. Кластеризація виконується методом ЛДА.

Однак для цього способу повинні виконуватися деякі вимоги: від 50 до 100 образів на клас і не менше 100 класів (іншими словами, при реєстрації кожного з мінімум 100 людей, потрібно зробити до 100 знімків - досить багато піде часу), образи повинні бути певного масштабу , повинен бути чорний фон, а на людях повинен бути однаковий одяг. Таким чином, цю систему можна застосовувати тільки в установах, де прийнята офіційна форма одягу.

Аналіз локальних ознак полягає у тому, що на образі виділяються координати обличчя і локальних ознак (наприклад, куточки рота, ніс, очі і т.д.). Координати ознак і відстані між ними дозволяють описати обличчя за допомогою точок і параметрів, які потім будуть використовуватися при розпізнаванні.

В еластичній моделі форм обличчя образи з бази даних подаються у вигляді набору точок, що описують нижні 2/3 обличчя (без чола). Точки ставляться в місцях зміни контрасту (яскравості).

Моделі форми обличчя використовуються при реєстрації, ідентифікації, розпізнаванні рід/стать, розпізнаванні виразу обличчя, для віртуальної реконструкції.

Після редукції ознак обчислюється усереднена форма обличчя ("еластична" - відомо, в яких межах вона може змінюватися). Додатковими засобами при розпізнаванні є градієнти яскравості.

За еластичною моделлю можна визначити наявність вусів, бороди, окулярів. Стверджується, що рівень розпізнавання лежить в межах 86-97%, визначення становища обличчя 77-100%, виразу обличчя з точністю до 83%.

Такий спосіб виділення ознак представляє система розпізнавання облич Facelt розроблена корпорацією Visionics, яка успішно працює на вулицях англійського міста Ньюхем, а також в аеропортах, великих стадіонах і торгових центрах США. Технологія розпізнавання облич або безліч облич в складних сценах Facelt дозволяє автоматично виявити людську присутність, визначити місце розташування, виділити зображення, виконати ідентифікацію.

Система Facelt автоматично оцінює якість зображення для впізнання обличчя і, якщо необхідно, здатна його поліпшити. Вона також створює зображення обличчя з сегментів даних, генерує цифровий код або внутрішній шаблон, унікальний для кожного індивідуума. В системі закладений режим стеження за обличчями в часі, а також "стиснення" обличчя до розміру в 84 байта для використання в смарт картах, штрихових кодах і інших пристроях з обмеженим розміром зберігання.

Основою будь-якої системи розпізнавання обличчя є метод його кодування. Facelt використовує аналіз локальних характеристик для представлення зображення обличчя у вигляді статистично обґрунтованих, стандартних блоків даних. Даний математичний метод ґрунтується на тому, що всі обличчя можуть бути отримані з репрезентативної вибірки облич з використанням сучасних статистичних прийомів. Вони охоплюють пікселі зображення обличчя і універсально представляють лицьові форми. Фактично в наявності є набагато більше елементів побудови облич, ніж кількість самих частин обличчя. Однак виявляється, що синтезування даного зображення обличчя з високою точністю вимагає тільки малого числа (12-40) характерних елементів з повного доступного набору. Ідентичність обличчя визначається не тільки характерними елементами, але і способом їх геометричного об'єднання (тобто враховуються їх відносні позиції). Отриманий складний математичний код індивідуальної ідентичності - шаблон Faceprint - містить інформацію, яка відрізняє обличчю від мільйонів інших, і може бути складений і порівняний з іншими з феноменальною точністю. Шаблон не залежить від змін в освітленні, тону шкіри, наявності / відсутності очок, виразу обличчя, волосся на обличчі та голові, стійкий до зміни в ракурсах до 35о в будь-яких напрямках.