СИСТЕМНИЙ АНАЛІЗ

О. М. Роїк, А. А. Шиян, Л. О. Нікіфорова

Навчальний посібник


3.9 Критерій Неймана-Пірсона

 

На практиці часто буває, що можуть бути невідомі не тільки апріорні ймовірності появи об’єктів відповідних класів, але й платіжні матриці. У таких системах для побудови алгоритму класифікації доцільно скористатися критерієм Неймана-Пірсона, суть якого полягає у такому.

Виходячи з того, що рішення приймаються за результатами експерименту над об’єктами, визначається допустиме (задане) значення умовної ймовірності помилки першого роду, а після цього визначається така границя між класами прийняття рішень, дотримуючись якої вдається досягти мінімуму умовної ймовірності помилки другого роду.

Нехай з деяких міркувань прийнято рішення, що допустима умовна ймовірність помилки першого виду не повинна перевищувати деякої постійної величини Q1 ≤ A. Треба визначити х0 для задачі minQ2 = min f2(x)dx за обмежень типу Q1 = ∫f2(x)dx ≤ А. Oчeвидно, що рішення xо задовольняє рівнянню ∫f1(x) dx = A, оскільки для значення хо` > хо умовна ймовірність помилок другого роду Q2 зростає. Обрати ж значення xо’ << хо не можна за умовою задачі.

На завершення розглянемо геометричну інтерпретацію вищевказаних критеріїв. Для цього в координатах Di = 1 – Qi і Qi побудуємо характеристику (рис. 3.4), відзначаючи що для Q1 = 0 Q2 = 1 і D2 = 0, і навпаки, для Q1 = l Q2 = 0 і D2 = l. Оскільки Q1 = ∫ f1(x)dx, a D2 = ∫ f2(x)dx, то продиференціювавши D2 по Q1, отримаємо, що:

, (3.49)

Однак, диференціал dD2/dQ1 ;є тангенсом кута нахилу дотичної до робочої характеристики для λ = λо. Тому, для визначення Q1 і D1 на основі застосування критерію Байеса на робочій характеристиці знайдемо точку, дотична у якій має нахил, що дорівнює λо = [Р1)с1/Р2)с2], тобто tg α = λo. Тепер ордината цієї точки визначає умовну ймовірність правильного рішення, а абсциса – означає умовну ймовірність помилки першого роду.

Для визначення Q1 і D2 за мінімаксним критерієм необхідно враховувати, що похідна від середнього ризику за апріорною ймовірністю P1) у точці його максимуму дорівнює нулю. Оскільки:

R = c11P1) (l – Q1) + с12P1)Q1 + с22[1 – P1)]D2 + c21[l – P1)](1 – D2),(3.50)

тo

R/∂P1) = c11(1 – Ql) + c12Q1 – c22D2 – c21(1D2) = 0.(3.51)

В координатах Q1 і Q2 це рівняння прямої і якщо с11 = с22, то:

D2 = Q1[c11 - c12)/(c21 - c22)]+1,(3.52)

з кутовім коефіцієнтом γ = tgβ = [(c11 – с12)/(c21 – с22)] + 1.

Проведемо на графіку (рис. 3.4) цю пряму АВ.

Подпись:
Рисунок 3.4 – Графіки функції Rmin = f [P1)] з прямою АВ

Координати точки перетину цієї прямої з робочою характеристикою визначають умовні ймовірності Q1 і D2 = 1 – Q2 в умовах застосування мінімаксного критерію. Тангенс кута нахилу дотичної у цій точці дорівнює λо.