В попередніх підрозділах розглянуто методи на основі статистичного аналізу зображення в просторовій або спектральній областях та методи на основі синтезу динамічних моделей, що відображають зміну зображення в просторі або часі. Спектральний аналіз та динамічні моделі можуть бути поєднані за допомогою визначення власних значень та власних функцій моделей. Перевагою такого підходу є те, що зображення може характеризуватись мінімальним числом параметрів, наприклад резонансних частот. Причому, відбираються тільки ті резонансні частоти, амплітуда яких найбільша. Відомо декілька підходів до реалізації декомпозиції на власні вектори:
1) синтез фільтрів на основі власних векторів зображення або його кореляційної матриці;
2) відбір принципових (найвпливовіших) компонент розкладання на власні або сингулярні вектори – Principal Component Analysis (PCA);
3) модальний аналіз – Empirical mode decomposition (EMD).
Метод РСА реалізують за допомогою сингулярного розкладання (Singular Value Decomposition – SVD). Перевагою SVD є те, що сингулярне розкладання реального сигналу дає систему ортогональних векторів, також реальних. Ортогональність та те, що дані реальні, спрощує алгебраїчні операції з матрицями.
Аналіз за допомогою розкладання по власним та сингулярним векторам застосовують по відношенню до сигналу зображення або його кореляційної матриці. Одною з різновидів кореляційної характеристики зображень є розподіл Вігнера.
Недоліком аналізу зображень за допомогою власних та сингулярних векторів є те, що для обчислення векторів потрібно значні обчислювальні ресурси. Більш простим є модальний аналіз. Емпіричні моди визначають за допомогою виділення локальних максимумів та мінімумів сигналу зображення та їх апроксимації поверхнею у вигляді полінома або за допомогою спеціальних функцій. Отримана мода вилучається із зображення і за допомогою сигналу остатку таким же способом визначають наступну моду. Такий ітераційний процес повторюють поки сигнал остатку не стане менше певного граничного значення. В результаті зображення є сумою модальних сигналів та незначного залишку. Моди використовують як характерні признаки зображення у вигляді масок для класифікації стаціонарних текстур та як кореляційні фільтри для класифікації динамічних текстур.
Алгоритм аналізу зображень за допомогою власних векторів залежить від того, як вони використовуються – як фільтри чи як базис для спектрального аналізу.
Так як задачі розпізнавання об’єктів заключається в класифікації зображень на основі певних критеріїв, то важливим етапом є вибір оптимального класифікатора. Серед існуючих методів класифікації можна виділити наступні:
Класифікатор Байєса є найбільш широко розповсюдженим з перелічених класифікаторів і застосовується при наявності повної апріорної інформації про класи, тобто коли відомі функція правдоподібності для кожного з класів, матриця штрафів, апріорні ймовірності для кожного з класів. Класифікатор Байєса ґрунтується на основі принципу максимуму апостеріорної ймовірності, що базується на трьох гіпотезах:
1. Множина є імовірнісним простором з імовірнісною мірою . Прецеденти з’являються випадково і незалежно у відповідності з розподілом .
2. Відомі щільності розподілу класів , що називаються функціями правдоподібності.
3. Відомі ймовірності появи об’єктів кожного з класів , що називаються апріорними ймовірностями.
Базуючись на даних гіпотезах, принцип максимуму апостеріорної ймовірності записується в наступному вигляді:
Доведено, що такий вибір вирішального правила є оптимальним з погляду мінімізації загального ризику. Основна проблема, полягає в тому, що на практиці гіпотези 2 і 3 майже ніколи не виконуються. Спроби оцінити ці функції розподілу по навчальній вибірці могли б привести до деякого результату, якби не погана обумовленість задачі, що приводить до вироджених рішень.
Існують системи виявлення об'єктів зображення, що базуються на "наївному" баєсовому методі. Даний метод ґрунтується на побудові емпіричної щільності розподілу ймовірностей класів по навчальній вибірці за припущення про незалежність компонентів вектора ознак.
Практичні результати є наступними:
1. Алгоритм побудови "наївного" баєсового класифікатора схильний до перенавчання;
2. Алгоритм побудови "наївного" баєсового класифікатора чутливий до шуму, тому що базується на емпіричних функціях щільності розподілу;
3. Швидкість роботи самого класифікатора висока, основний час може займати обчислення вектора ознак.
На основі сполучення байесового підходу і теорії графів утворюють байєсові мережі. Суть даного підходу в тому, що будують граф, кожна вершина якого відповідає якому-небудь компоненту вектора ознак, дуги позначають причинно-наслідковий зв'язок. Побудова мережі може бути здійснена автоматично шляхом аналізу кореляції компонентів вектора ознак.
Проблемою для баєсової мережі є погана обумовленість, тому що велика розмірність вектора ознак робить граф зв'язків складним для побудови й аналізу. Також сильно зростає обчислювальна складність. Одним з варіантів розв’язання даної проблеми є скорочення розмірності вектора ознак, що приводить до погіршення узагальнюючої здатності.
Класифікація за статистичними признаками можлива після попередньої обробки зображення за допомогою фільтрів, що дозволяють зменшити варіацію параметрів ознак.
Наряду з статистичними методами класифікації в обробці зображень використовують евристичні методи. Це ряд підходів, що можна розділити на наступні групи.
1. Евристичні методи:
2. Метод порівняння з шаблоном. Складається шаблон для зображення всього об'єкта чи його характерних ознак. Також вводиться функція перевірки відповідності.
3. Методи з навчанням по прецедентах. Модель автоматично будується на основі набору зображень об'єкта, складених заздалегідь з можливих вхідних даних системи.
Евристичні методи є історично найбільш ранніми, вони досить прості в реалізації і працюють з високою швидкістю, однак жорстко запрограмовані правила позбавляють систему гнучкості і стійкості. Як правило, евристичні системи орієнтовані на відносно вузький клас задач.
Метод порівняння з шаблоном є більш універсальним підходом, однак даний метод вимагає наявності дуже точного шаблона об'єкта зображення. Шаблон може бути складною структурою і допускати різні деформації і перетворення, таким чином, сприяючи інваріантості системи до просторових спотворень об'єкта зображення і змін освітленості. Системи, засновані на порівняння з шаблоном, найчастіше використовуються для розв’язання задач відстеження об'єктів у відео з ініціалізацією на першому кадрі – до початку роботи системи існує загальна модель шаблона, при ініціалізації вона уточнюється і коректується під час роботи системи. При добре заданому шаблоні досягається висока точність і дуже низький рівень збоїв. Інваріантість до просторових спотворень і зміни освітлення залежить від складності шаблона.
Методи з навчанням по прецедентах є найбільш загальним підходом. Задача розпізнавання об'єктів зображення зводиться до задачі класифікації і для неї застосовується добре розроблений математичний апарат побудови моделі (навчання) по прецедентах. Модель будується автоматично по заздалегідь зібраному наборі прецедентів – зображень, для яких відомо, чи є вони зображеннями об'єкта чи ні. Спостереженням, у даному випадку, є деякий "вектор ознак", отриманий з вихідного зображення за допомогою перетворення, що відображає зображення в просторі дійсних векторів. Гіпотеза, що підлягає перевірці – приналежність зображення до класу зображень шуканого об'єкта. Таким чином, система розпадається на два модулі – модуль перетворення зображення у вектор ознак і модуль класифікації. Задачею модуля перетворення є найбільш повне й інформативне представлення зображення у виді числового вектора. Задачею модуля класифікації є перевірка гіпотези приналежності зображення класу зображень об'єкта на підставі спостереження, яким є вектор ознак. Серед евристичних найбільш поширені методи:
опорних векторів (SVM, supporting vectors method);
Sparse network of Wіnnows (SNoW);
посилення слабких класифікаторів (classіfіer boostіng).
Метод SVM полягає в побудові оптимального лінійного класифікатора. Класичний алгоритм полягає в побудові лінійної поверхні (гіперплощини), яка рівновіддалена від опуклих оболонок класів, опукла оболонка будується по прецедентах. Стверджується, що така гіперплощина буде оптимальна, з погляду загального ризику, щодо будь-яких інших можливих гіперплощин. Якщо така гіперплощина не існує (класи лінійно не роздільні), то для здійснення нелінійної класифікації застосовується ядрове перетворення, що проектує вихідний простір у простір ще більшої, можливо нескінченної, розмірності.
Метод опорних векторів був успішно застосований для задачі розпізнавання об'єктів зображення. Метод характеризується наступним:
висока стійкість до перенавчання;
чутливість до шуму може регулюватися за рахунок зменшення точності;
в системах розпізнавання об'єктів метод дає прискорення в декілька разів у порівнянні з нейронними мережами.
SNoW – особливий вид нейронної мережі. Вектор ознак бінарний. Мережа складається з двох (по числу можливих класів) лінійних нейронів, зв'язаних з компонентами вектора ознак. Класифікація проходить за принципом “переможець забирає все”. Метод SNoW вважається досить ефективним методом для розв’язання задач виявлення об'єктів зображення. Відповідно до деяких досліджень SNoW перевершує по своїм параметрам метод опорних векторів.
Сlassіfіer boostіng – це підхід до розв’язання задачі класифікації, шляхом комбінування примітивних класифікаторів в один більш сильний класифікатор. Основна ідея методу полягає в ітеративній мінімізації опуклого функціонала помилки класифікації, шляхом додавання в набір класифікаторів чергового слабкого класифікатора. Для систем розпізнавання об'єктів зображення був застосований каскадний підхід, який полягає в побудові каскаду із комплексу слабких класифікаторів, що працює за принципом послідовних наближень. Характеристики каскадного методу перевершують всі інші системи.
По показникам роботи в реальних системах розпізнавання об'єктів зображення найбільш вдалими виявилися алгоритми boostіng (посилення слабких класифікаторів) і SNoW. Обидва підходи забезпечують високу швидкість, високий рівень розпізнавання і низький рівень похибок другого роду. Метод опорних векторів досить сильно уступає по показниках перерахованим вище підходам, тому що має дуже низький відсоток вірних виявлень.