3.5. Нормальний розподіл (закон Гаусса)

 

Нормальний закон розподілу (normal law of distribution) (який ще називається законом Гаусса) відіграє виключно важливу роль в теорії ймовірностей і займає серед інших законів розподілу особливий стан. Це закон, який найчастіше зустрічається на практиці. Головна особливість, яка виділяє нормальний закон серед інших законів, полягає в тому, що він є граничним законом, до якого наближаються інші закони розподілу.

Так, наприклад, велика кількість гарматних пострілів, здійснених в різних умовах, показує, що розсіювання снарядів на площині при пострілі з однієї гармати при встановленому прицілі підлягає нормальному закону.

“Універсальність” нормального закону пояснюється тим, що будь-яка випадкова величина, яка є сумою великої кількості окремих числових значень, кожне з яких підпорядковується різним законам розподілу і несуттєво впливає на суму, розподілена майже за нормальним законом.

Більшість випадкових величин, таких, наприклад, як похибки вимірів, похибки гарматних стрільб і т. д. можуть бути подані як суми великої кількості малих доданків  елементарних похибок, кожна з яких визначається дією окремої причини, яка не залежить від інших. Яким би законам розподілу не підпорядковувались окремі елементарні похибки, особливості цих розподілів в сумі великої кількості доданків нівелюються і сума підпорядковується закону, що близький до нормального. Підсумовані похибки в загальній сумі повинні грати відносно малу роль.

Випадкова величина ξ нормально розподілена або підпорядковується закону розподілу Гаусса, якщо її щільність розподілу має вигляд:

, де а  довільне дійсне число, > 0.

Нижче буде доведено а = Мξ , Dξ = .

Виходячи з даного визначення, функція розподілу може бути записана:

.

Графік функції симетричний відносно прямої х=а. За допомогою похідних можна показати, що функція досягає максимуму при х=а, а її графік має точки перетину при х1=а+σ і х2=а-σ (рис. 3.3).

При графік функції асимптотично наближається до осі Ох:

Даний розподіл названо в честь німецького математика Карла Фрідріха Гаусса, який займався проблемами теорії ймовірності.

При збільшенні крива щільності розподілу стає більш пологою (рис. 3.4).

Навпаки, при зменшенні графік щільності розподілу більше стискається до осі Оу. При а = 0 віссю симетрії є вісь Оy. На рис. 3. 4. зображено два графіка функції у = f(х).

Графік (I) відповідає значенням: а = 0 , = 1.

Графік (II) відповідає значенням: а = 0 , = 1/2.

Покажемо, що функція f(х) задовольняє умову

тобто при довільних а і виконується співвідношення:

.

Зробимо в цьому інтегралі заміну змінної, покладаючи . Тоді

.

Запишемо різні форми відомої формули Пуассона:

I. ;

II. ; (3.1)

III. .

Використовуючи першу з них, одержимо:

.

Знайдемо імовірність попадання величини в заданий інтервал:

,

Зробимо в цьому інтервалі заміну змінної: .

Тоді , і

Останній інтеграл не розв’язується в елементарних функціях. Тому для визначеного інтеграла вводиться функція

,

яка називається інтегралом імовірності (probability integrals). Для цієї функції складено таблиці її значень (додаток А). Після перетворень одержимо:

.

+

.               (3.2)

На рис. 3.5 зображено інтегральну функцію розподілу F(x).

Інтеграл ймовірностей має властивості:

1) ;

2); .

3) , інтеграл ймовірностей  непарна функція.

Нехай . Знайдемо імовірність того, що нормально розподілена випадкова величина відхиляється від параметра а за абсолютною величиною не більше, ніж на , тобто Нерівність рівносильна нерівностям . Беремо в рівності (3. 2) , і одержимо:

,

Внаслідок того, що інтеграл ймовірностей непарна функція:

.

Тому (3.3)

Приклад 1. Нехай в. в. підпорядковується нормальному закону розподілу ймовірностей з параметрами , . Визначити:

1) ,

2) .

Розв’язання.

Використовуючи формулу (3.2), одержимо:

;

З таблиці (додаток А) знаходимо: , .

Отже, .

, .

За формулою (3.3)

.

Приклад 2. В яких границях буде змінюватись випадкова величина, яка підпорядковується нормальному закону розподілу, щоб виконувалась рівність ?

Розв’язання.

, . З таблиці (додаток А) знаходимо, що цьому значенню відповідає , звідки .

Одержаний факт означає: якщо в. в. підпорядковується нормальному закону розподілу, то можна стверджувати, що з імовірністю 0,9973 в. в. знаходиться в інтервалі .

Дана ймовірність наближається до одиниці, тому вважають, що значення нормально розподіленої в. в. практично не виходять за границі інтервалу . Цей факт називають “правилом трьох сигм”.

Для нормально розподіленої в. в. всі відхилення (з точністю 0,9973) знаходяться на інтервалі .

З правила трьох сигм випливає спосіб визначення середнього квадратичного відхилення: беруть максимальне практично можливе відхилення від середнього і ділять на три. Таке грубе обчислення рекомендують у випадку, коли немає інших способів визначення

Знайдемо математичне сподівання і дисперсію для нормального закону розподілу:

=

=,

тому що

і за властивістю непарних функцій

.

Математичне сподівання для нормального закону дисперсія  середнє квадратичне відхилення.

Приклад 3. По автостраді, яка має вигляд смуги завширки 20 м, ведеться обстріл в напрямку, перпендикулярному автостраді. Прицілювання ведеться по середній лінії автостради. Середнє квадратичне відхилення в напрямку обстрілу дорівнює м. Робиться систематична помилка в напрямку обстрілу: постріли не долітають 3 м. Знайти імовірність попадання в автостраду при одному пострілі.

Розв’язання.

Виберемо початок координат в довільній точці на середній лінії автостради і направимо вісь абсцис перпендикулярно автостраді. Попадання або непопадання снаряда в автостраду визначається значенням тільки однієї координати точки падіння снаряду (друга координата не має значення).

В. в. розподілена за нормальним законом з параметрами , .

Попадання снаряду в автостраду відповідає попаданню в. в. на ділянку від до .

Використовуючи формулу (3.2), одержимо:

.

Приклад 4. Розмір діаметра втулок що виготовляються в цеху, можна вважати нормально розподіленою в. в. з математичним сподіванням см і дисперсією см2. В яких границях можна практично гарантувати розмір діаметра втулки, якщо імовірність практичної достовірності приймається 0,9973.

см; ; ; ;

.

Можна гарантувати діаметр втулки в інтервалі (2,47  2,53) см.

Виникнення нормального закону розподілу як одного з фундаментальних законів (the fundamental laws) теорії ймовірності пов’язано безпосередньо з розвитком теорії похибок. Іще Тихо де Браге у 80-х рр. XVI ст. для усунення похибок проводив спостереження одного і того ж об’єкта у видозмінених умовах, і, комбінуючи ці спостереження, намагався позбавитися від випадкових похибок.

А. Лежандр у своїй роботі «Нові методи для визначення орбіт комет» в додатку «Про метод найменших квадратів» запропонував спосіб найменших квадратів: «Коли всі умови задачі виражені відповідним чином, потрібно так визначити коефіцієнти, щоб похибки були щонайменші».

Цей метод полягає в тому, щоб зводити суму квадратів похибок до мінімуму. «Рівнянь отримуємо рівно стільки, скільки є невідомих... Спосіб, який я називаю способом найменших квадратів, мабуть, зможе принести велику користь у всіх питаннях фізики і астрономії, де потрібно отримати найбільш точний результат». Багато питань теорії похибок змогли бути розв’язаними лише завдяки теорії ймовірностей.

Яким способом розподіляються похибки при вимірюваннях? Чи підлягають вони певному закону? Чи існує спосіб визначення межі числового значення похибки при даному вимірюванні? Ці питання постали перед вченими у кінці XVIII століття. Їх вирішення стало можливим лише завдяки теорії ймовірностей.

На початку XIX ст. два математики, незалежно один від одного, майже одночасно знайшли закон, за яким розподіляються випадкові похибки. Це нормальний закон розподілу.

Першим із цих математиків був великий німецький вчений К. Ф. Гаусс (1777-1855 рр.), другий – маловідомий американський математик Р. Едрейн  (1775-1843 рр.). До кінцевого результату – нормального закону розподілу кожен з математиків йшов своїм шляхом.

Робота Едрейна була опублікована в 1808 році, робота Гаусса “Теорія руху” вийшла у світ в 1809 році. Р. Едрейн розв’язував конкретну задачу, при її узагальненні й отримав розподіл в. в. (похибок).

Гаусc займався астрономією і геодезією, що привело його до баготочисельних способів обробки результатів. В астрономії і геодезії проводяться баготочисельні вимірювання в різних місцях, різними інструментами. Результати цих вимірювань допускали помилки. Тому перед Гауссом постало питання встановлення найбільш ймовірного значення шуканої величини.

Розрахунки привели Гаусса до фундаментального способу найменших квадратів, який розробляв Лежандр, і до вияснення центрального значення нормальної кривої розподілу в питаннях, що пов’язані з теорією ймовірності.

Теорія похибок, розроблена Гауссом, вимагала умов застосування нормального закону розподілу, що, у свою чергу, спричинило появу задачі про оцінку параметрів нормального закону розподілу. Гаусс обґрунтував спосіб найменших квадратів за допомогою теорії ймовірностей.

Вперше метод найменших квадратів був опублікований Гауссом в 1809 р. В одному зі своїх листів до Ольберта Гаусс пише: “Щоб найкращим чином представити декілька величин, яким не можна дати точних значень, потрібно звести до мінімуму суму квадратів похибок”. Гаусc робить акцент на тому, що результати повинні бути не з окремих спостережень, а з комбінованих. При цьому, похибки, по можливості, будуть знищуватись.

Гаусс розглядає таку задачу. При однакових змінах деякої величини випадкові похибки мають диференціальну щільність розподілу ймовірностей . Потрібно визначити при умові, що найбільш імовірнісне значення величини, яку вимірюємо, дорівнює середньому арифметичному з усіх значень.

Наведемо міркування Гаусса.

Ймовірність, яку приписуємо будь-якій похибці , одержуємо як функцію від , яку ми будемо позначати ... Ми можемо вважати, що її максимум буде, коли , і в більшості випадків вона однакова для рівних і протилежних за знаком значень . повинна бути складена так, щоб від значення в обидва боки вона асимптотично наближалася до нуля. Гаусс у своїх міркуваннях приходить до висновку, що . Величину h він розглядає як міру точності спостережень.

Згодом, як наслідок, вчений вивів твердження про те, що щільність ймовірності даної сукупності спостережень досягає максимального значення за умови, що сума квадратів відхилень спостережених значень перетворюється в мінімум.

У творі “Визначення точності спостережень” (1957) розглядається оцінка h за результатами спостережень. Тут Гаусс вводить в розгляд функцію = і наводить невелику таблицю значень цієї функції. Для аргументу t, при ; він вводить позначення (тобто ), причому .

Величину він назвав імовірнісною помилкою для функції .

У своїй роботі “Теорія комбінацій спостережень, що мають найменші похибки” Гаусc стверджує, що вимірювання завжди матимуть похибки. Одні з цих похибок матимуть випадковий характер, інші – змінюються за певним законом, все залежить від умови задачі. Гаусс широко охоплює поняття щільності розподілу ймовірностей похибок, позначаючи їх тут . Додатні і від’ємні похибки однієї і тієї ж величини бувають однаково часто, тому . Менші похибки зустрічаються частіше, ніж більші, тому значення буде максимальним при х=0 і постійно зменшується зі зростанням х. Очевидно, що .

Питання для самоперевірки

1. Назвіть основні розподіли для дискретних і неперервних випадкових величин.

2. Який розподіл називається рівномірним? Основні параметри розподілу.

3. Показниковий розподіл та його властивості.

4. Нормальний розподіл або закон Гаусса. Функції розподілу.

5. З чим пов’язане виникнення нормального закону розподілу?

6. Які математики прийшли одночасно до виведення нормального закону розподілу?

7. Запишіть інтеграл імовірностей. Яке він має застосування?

8. Сформулюйте правило “трьох сигм”.