РОЗДІЛ 4 МЕТОДИ АНАЛІЗУ ВЕЛИКИХ СИСТЕМ
4.1 Планування експериментів
Ще на початку розгляду питань про цілі і методи системного аналізу ми знайшли ситуації, у яких немає можливості описати елемент системи, підсистему і систему в цілому аналітично, використовуючи системи або рівняння хоча б нерівностей. Іншими словами – ми не завжди можемо побудувати чисто математичну модель на будь-якому рівні – елемента системи, підсистеми або системи у цілому. Такі системи іноді дуже влучно називають «погано організованими» або «слабко структурованими».
Так уже склалося, що протягом майже 200 років після Ньютона у науці вважалося непорушним положення про можливість «чистого» або однофакторного експерименту. Передбачалося, що для з’ясування залежності величини Y = f (X) навіть за умови очевидної залежності Y від багатьох інших змінних завжди можна стабілізувати всі змінні, крім X, і знайти «особистий» вплив X на Y.
Лише порівняно недавно (див. роботи В. В. Налімова) погано організовані або, як їх ще називають – великі системи цілком «законно» стали вважатися особливим середовищем, у якому невідомими є не лише зв’язки всередині системи, але і самі елементарні процеси. Аналіз таких систем (у першу чергу соціальних та економічних) можливий лише при єдиному, науково обґрунтованому підході – визнанні схованих, невідомих нам причин і законів процесів. Часто такі причини називають латентними факторами, а особливі властивості процесів – латентними ознаками.
Виявилася і вважається також загальновизнаною можливість аналізу таких систем з використанням двох, принципово різних підходів або методів.
- Перший з них це методом багатомірного статистичного аналізу. Цей метод був обґрунтований і застосований відомим англійським статистиком Р. Фішером у 20-30 роках цього сторіччя. Подальший розвиток багатомірної математичної статистики як науки так і основи багатьох практичних додатків вважається причинно зв’язаним з появою й удосконалюванням комп’ютерної техніки. Якщо у 30-і роки, під час ручної обробки даних вдавалося розв’язувати задачі, в яких існувало 2–3 незалежних змінних, то у 60-і роки розв’язувалися задачі з 6 змінними, а до 70–80 років їх число вже наближалося до 100.
- Другий метод, який прийнято називати кібернетичним або «вінерівським», зв’язуючи його назву з батьком кібернетики Н. Вінером. Коротка сутність цього методу – чисто логічний аналіз процесу керування великими системами. Поява цього методу була цілком природньою – так як ми визнаємо існування погано організованих систем, то логічним буде порушити питання про пошук методів і засобів керування ними. Зовсім безглуздо порушувати питання про розподіл струмів в електричних колах – ці процеси є добре організованою (законами природи) системою.
Цікаво, що обидва методи, незважаючи на розходження між собою, можуть застосовуватися і з успіхом застосовуються під час системного аналізу одних і тих самих систем.
Так, наприклад, інтелектуальна діяльність людини вивчається «фішерівським» методом – багато психологів, як іронічно зауважує В. В. Налімов, «упевнені, що їм вдасться розібратися в результатах численних тестових іспитів». З іншого боку, побудова так званих систем штучного інтелекту є спробою створення комп’ютерних програм, що імітують поводження людини в області розумової діяльності, тобто застосування «вінерівського» методу.
Очевидно, що економічні системи, швидше за все, слід віднести саме до погано організованих, насамперед, тому, що одним з видів елементів у них є людина. А якщо це так, то не дивно, що під час системного аналізу в економіці буде потрібений «реальний» експеримент.
У найпростішому випадку мова може йти про деякий елемент економмічної системи, про який нам відомі лише зовнішні впливи (що потрібно для нормального функціонування елемента) і вихідні його реакції (що повиненен «робити» цей елемент).
Однією з рятівних ідей, може бути ідея розгляду такого елемента як «чорного ящика». Використовуючи цю ідею, ми розуміємо, що не в змозі простежити процеси всередині елемента і сподіваємося побудувати його модель без таких знань. Нагадаємо класичний приклад – незнання процесів травлення в організмі людини не заважає нам організовувати своє харчування по «входу» (продукти, які ми споживаємо, режим харчування і т.д.) з врахуванням «вихідних» показників (ваги тіла, самопочуття й інших).
Отже, наші наміри цілком конкретні, а саме «що робити» – ми збираємося подавати на вхід елемента різні зовнішні, керуючі впливи і слідкувати за його реакціями на ці впливи.
Тепер треба настільки ж чітко вирішити – а навіщо ми це будемо робити, що ми сподіваємося отримати. Питання це непросте, нечасто можна дозволити собі просто задовольнити свою допитливість.
Як правило, експерименти над реальними системами є вимушеною процедурою, зв’язаною з певними витратами на сам експеримент і, крім того, з ризиком непоправних негативних наслідків.
Теоретичне обґрунтування і методика дій у таких ситуаціях складають предмет особливої галузі науки – теорії планування експерименту.
Визначимо, яку термінологію будемо вживати:
– усе, що подається на вхід елемента, будемо називати керуючими впливами або просто впливами;
– усе, що виходить на виході елемента, будемо називати реакціями;
– якщо ми можемо виділити у системі (підсистемі) декілька однотипних елементів, то їх сукупність будемо називати блоком;
– змістовний опис своїх дій щодо елементів блоку будемо називати планом експерименту.
Дуже важливо зрозуміти мету експерименту, що планується. Зрештою, ми можемо і не отримати ніякої інформації про сутність процесів у ланцюгу «вхід-вихід» у самому елементі. Але якщо ми знайдемо корисність деяких, доступних нам впливів на елемент і переконаємося в надійності отриманих результатів, то досягнемо головної мети експерименту – знаходження оптимальної стратегії керування елементом. Неважко зрозуміти, що поняття «керуючий вплив» дуже широке – від звичайних наказів до підключення до елемента джерел енергетичного або інформаційного «живлення». Виявляється, що вже саме складання плану експерименту вимагає визначених знань і деякої кваліфікації. Досвід доводить доцільність включення в план таких чотирьох компонентів:
– опис множини стратегій керування, серед яких ми сподіваємося вибрати найкращу;
– специфікацію або детальний порівняльний опис елементів блоку;
– правила розміщення стратегій на блоці елементів;
– специфікацію вихідних даних, що дозволяють оцінювати ефективність елементів.
Детальний розгляд компонентів плану експерименту дозволяє помітити, що для його реалізації потрібні знання в різних областях науки, навіть якщо мова йде про економічну систему. Так, під час вибору керуючих впливів не обійтися без мінімальних знань з області технології, дуже часто потрібні знання і в області юридичних законів, екології. Для реалізації третього компонента необхідні знання у області математичної статистики, оскільки потрібно використовувати поняття розподілів випадкових величин, їх математичних сподівань і дисперсій. Також можуть виникнути і ситуації, що вимагають застосування непараметричних методів статистики.
Для того, щоб показати труднощі, що виникають під час складання плану експерименту і навіщо потрібно розуміти методи використання результатів експерименту, розглянемо найпростіший приклад.
Нехай ми виконуємо системний аналіз фірми, що здійснює торгівлю за допомогою мережі «фірмових» магазинів і маємо можливість спостерігати той самий вихідний показник елемента такої системи (наприклад, денний виторг магазина фірми).
Очевидним є прагнення знайти спосіб підвищення цього показника, а якщо таких способів виявиться декілька – потрібно вибрати найкращий. Припустимо, що відповідно до першого пункту правил планування експерименту, ми вирішили випробувати чотири стратегії керування магазинами. Коли вже таке рішення прийняте, то нерозумно обмежувати експеримент одним елементом, якщо їх у системі досить багато і ми не маємо впевненості в «еквівалентності» умов роботи всіх магазинів фірми.
Нехай ми маємо N магазинів – досить багато, щоб провести «масовий» експеримент, але їх не можна віднести до одного типу. Наприклад, ми можемо розрізняти чотири типи магазинів: А, Б, В і Г (аптечні, бакалійні, горілочні і галантерейні).
Зрозуміло також і те (хоча для цього потрібно розбиратися в технології торгівлі), що виторг магазина може цілком істотно залежати від дня тижня – нехай робочі дні всіх магазинів: Ср, Пт, Сб, Нед.
Перше, «просте» рішення – вибрати з N кілька магазинів навмання (застосувавши рівновірогідний розподіл їх номерів) і використовувати певний час нову стратегію керування ними. Але такі прості міркування приводять до думки, що це буде не краще рішення. І справді – ми розглядаємо елементи системи як «рівноправні» за декількома показниками:
– ми шукаємо єдину (найкращу) для фірми стратегію керування;
– ми використовуємо єдиний для всіх елементів показник ефективності (денний виторг).
У той же час, ми самі розділили об’єкти на групи і тим самим визнаємо розходження у зовнішніх умовах роботи для різних груп. Мовою ТССА це означає, що професійні знання в області керування торгівлею допомагають нам припустити наявність, принаймні, двох причин або факторів, від яких може залежати виторг: профіль товарів магазина і день тижня. Ні те, ні інше не може бути стабілізоване – інакше ми будемо шукати щось інше: стратегію керування лише горілочними магазинами і лише по п’ятницях! А наша задача – пошук стратегії керування усіма магазинами і в усі дні їх роботи.
Хотілося б вирішити цю задачу таким чином: вибирати випадково як групи магазинів, так і дні тижня, але мати гарантію (уже не випадково!) показності вихідних даних іспитів стратегії.
Теорія планування експерименту пропонує особливий метод розв'язання цієї проблеми, метод забезпечення або випадковості рандомізації плану експерименту. Цей метод заснований на побудові спеціальної таблиці, що називають латинським квадратом для числа факторів рівному двом.
Для нашого прикладу, з числом стратегій 4, латинський квадрат може мати вигляд табл. 4.1 або табл. 4.2.
Ср | Пт | Сб | Нед | |
---|---|---|---|---|
А | 1 | 2 | 3 | 4 |
Б | 3 | 4 | 1 | 2 |
В | 2 | 1 | 4 | 3 |
Г | 4 | 3 | 2 | 1 |
1 | 2 | 3 | 4 | |
---|---|---|---|---|
Ср | А | Б | В | Г |
Пт | В | Г | А | Б |
Сб | Б | А | Г | В |
Нед | Г | В | Б | А |
У клітинах першої таблиці зазначено номери стратегій для днів тижня і магазинів даного профілю, причому такий план експерименту гарантує перевірку кожної стратегії у кожному профілі торгівлі у кожен день роботи магазина. Звичайно, таких таблиць може бути багато – правила комбінаторики дозволяють знайти повне число латинських квадратів: для «4×4» це число дорівнює 576, для квадрата «3×3» – лише 12, а для «5×5» – 161 280.
У загальному випадку, за наявності t стратегій і двох факторах, що визначають ефективність, буде потрібно N = a×t2 елементів для реалізації плану експерименту, де a у найпростішому випадку дорівнює 1. Це означає, що для нашого прикладу необхідно використовувати 16 «керованих» магазинів, оскільки дані другого рядка і третього стовпця, нашого латинського квадрата означають, що по суботах в одному з обраних навмання бакалійних магазинів буде застосовуватися стратегія номер 1.
Відзначимо, що латинський квадрат для нашого прикладу може бути побудований зовсім інакше (таблиця 4.2), однак, як і раніше буде визначати той же, рандомізований план експерименту.
Нехай ми провели експеримент і отримали його результати у вигляді табл. 4.3, у клітинах якої зазначені стратегії і результати їх застосування у вигляді сум денного виторгу.
Дні | Магазини | Сума | |||
---|---|---|---|---|---|
А | Б | В | Г | ||
Нед | 2: 47 | 1: 90 | 3: 79 | 4: 50 | 266 |
Ср | 4: 46 | 3: 74 | 2: 63 | 1: 69 | 252 |
Пт | 1: 62 | 2: 61 | 4: 58 | 3: 66 | 247 |
Сб | 3: 76 | 4: 63 | 1: 87 | 2: 59 | 285 |
Сума | 231 | 288 | 287 | 244 | 1050 |
Разом за стратегіями: | 1308 | 2230 | 3295 | 4217 | 1050/4=262,5 |
Якщо обчислити, як і потрібно, середні значення, дисперсії і середньо-квадратичні відхилення для четвірок значень денного виторгу (по днях, магазинам і стратегіям), то ми будемо мати дані, представлені в табл. 4.4.
Дні тижня | Магазини | Стратегії | |
---|---|---|---|
Середнє | 262.5 | 262.5 | 262.5 |
Дисперсія | 217.3 | 646.3 | 1562.3 |
СКО | 14.74 | 25.42 | 39.50 |
Коеф.варіації | 0.056 | 0.097 | 0.151 |
Вже така примітивна статистична обробка даних експерименту дозволяє зробити ряд важливих висновків:
– порівняно малі значення розсіювання даних по днях тижня і по категоріях магазинів, що вказує на правильний вибір плану експерименту;
– розкид значень по стратегіях швидше за усе свідчить про більшу залежність денного виторгу від стратегії, ніж від днів тижня або категорії магазина;
– помітна відмінність середнього по 1-й і 3-й стратегіях від середніх по 2-й і 4-й, з цього можна зробити висновок – шукати найкращу стратегію, вибираючи між 1-ою і 3-ою.
У цьому і полягає прямий практичний результат використання рандомізованого плану, побудови латинського квадрата.
Але це ще не все. Теорія планування експерименту дає, крім способів побудови планів з урахуванням можливих впливів на величину інших факторів, ще й особливі методи обробки отриманих експериментальних даних. Сутність цих методів може бути представлена таким чином.
Нехай Wis є виторг у i-у магазині при застосуванні до нього s-ї стратегії керування. Будемо розглядати цей виторг як суму складових:
Wis = W0 + Δs + εi,(4.1)
де W0 – визначає середній виторг для всіх магазинів за умови застосування до кожного з них всіх стратегій по черзі з дотримання всіх інших умов, що впливають на виторг;
W0 + Δs – є середній виторг при застосуванні до всіх магазинів s-ї стратегії;
εi – розглядається як «помилка виміру» – випадкова величина з нульовим математичним очікуванням і нормальним законом розподілу.
Незважаючи на очевидну нереальність дотримання постійних зовнішніх факторів, що впливають, ми можемо отримати оцінку кожної із складових Wis і шукати оптимальну стратегію через збільшення від її застосування з урахуванням помилки спостереження.
Можна вважати доведеною «нормальність» розподілу величини εi і використовувати «правило трьох сигм» для прийняття рішень за підсумками експерименту.