3.3 Методи непараметричної статистики
Використання класичних розподілів випадкових величин зазвичай називають «параметричною статистикою». При цьому, робиться припущення про те, що цікавляча нас ВВ (дискретна або неперервна) має ймовірності, що обчислюються за деякими формулами або алгоритмами. Однак не завжди для цього є підстави. Причинами у тому, найчастіше, є дві:
– деякі випадкові величини просто не мають кількісного опису, тобто обґрунтованих одиниць виміру (рівень знань, якість продукції і т.п.);
– спостереження над величинами можливі, однак їх кількість надто мала для перевірки припущення (гіпотези) про тип розподілу.
На даний час у прикладній статистиці усе більшою популярністю користуються методи так званної непараметричної статистики, тобто, коли питання про належність розподілу ймовірностей даної величини до того або іншого класу взагалі не підіймається, однак, задача оцінки самої ВВ, тобто, отримання інформації про неї, залишається.
Одним з основних понять непараметричної статистики є поняття шкали або процедури шкалування значень ВВ. За своїм змістом така процедура шкалування полягає у вирішенні питання про «одиниці виміру» ВВ. Зазвичай прийнято використовувати чотири типи таких шкал.
Nom – номінальна шкала, тобто шкала, що застосовується до тих величин, що не мають природної одиниці виміру. Якщо деяка величина може приймати на своїй номінальній шкалі значення X, Y або Z, то справедливими вважаються тільки вирази типу: (X # Y), (X # Z), (X = Z), у той час як вирази типу (X > Y), (X < Z), (X + Z) не мають ніякого сенсу. Прикладами ВВ, до яких застосовні тільки номінальні шкали можуть бути такі величини як стать, колір, марка автомобіля і т.п.
Ord. Другий спосіб шкалування, це використання порядкових шкал. Вони незамінні для ВВ, що не мають природних одиниць виміру, однак, які дозволяють застосовувати поняття переваги одного значення над іншим. Типовий приклад: оцінка знань (навіть при нечисловому опису), службові рівні і т.п. Для таких величин дозволені не лише відношення рівності (= або #), але й знаки переваги (> або <). Іноді говорять про ранги значень таких величин.
Int & Rel – це два способи шкалування, що використовуються для ВВ, і які мають натуральні розмірності, тобто інтервальна і відносна шкала. Для таких величин, крім відношень рівності і переваги можуть застосовуватись операції порівняння, тобто, усі чотири дії арифметики. Головна особливість таких шкал полягає у тому, що різниця двох значень, наприклад, на шкалі (36 і 12) має один зміст для будь-якого місця шкали (28 і 4). Розходження між інтервальною шкалою і відносною є тільки у понятті нуля, тобто, на інтервальній шкалі 0 кг ваги означає відсутність ваги, а на відносній шкалі температур 0градусів не означає відсутність теплоти, оскільки, можливі температури, що будуть нижче 0 градусів за Цельсієм.
Звідси можна помітити ще одну перевагу, яку ми отримуємо під час використання методів непараметричної статистики, тобто, якщо ми зіштовхуємося з ВВ неперервної природи, то використання інтервальної або відносної шкали дозволить нам мати справу не з випадковими величинами, а з випадковими подіями, тобто, типу «ймовірність того, що вага продукції знаходиться в інтервалі 17 кг». Тому можна запропонувати єдиний підхід до опису всіх показників функціонування складної системи – опис на рівні простих випадкових подій (з ймовірністю P(X) може відбутися подія X). При цьому, під подією доведеться розуміти те, що випадкова величина займе одне з можливих для неї положень на шкалі Nom, Ord, Int або Rel.
Зазвичай такий, «мікроскопічний» підхід різко збільшує обсяг інформації, що необхідна для системного аналізу. Частково цей недолік пом’якшується при використанні комп’ютерних методів системного аналізу, але більш важливим є інше – перевага на початкових етапах аналізу, коли зважуються питання дезинтеграцї великої системи (виділення окремих її елементів) і наступної її інтеграції для розробки стратегії керування системою.
Не буде перебільшенням вважати, що методи непараметричної статистики – є могутнім засобом під час розв’язання задач системного аналізу у багатьох областях діяльності людини, і, зокрема, в економіці.