Теоретичні відомості

Експериментальні плани, що визначають програму досліджень для знаходження математичного опису об'єкта, будуються виходячи з різних критеріїв оптимальності. Широке поширення одержали ортогональні плани. Вони оптимальні з погляду простоти обробки отриманої інформації. А також ротатабельні плани. Вони забезпечують однакову інформацію на рівних відстанях від центра плану.

Однак ці критерії не висували ніяких вимог до характеристик, зв'язаних з точністю отриманого математичного опису. Тому з'явилися нові критерії оптимальності планування, такі, як величина визначника коваріаційної матриці оцінок коефіцієнтів (тобто узагальнена дисперсія оцінок коефіцієнтів), максимальне значення дисперсії пророкування рівняння регресії, середня дисперсія оцінок коефіцієнтів і інші.

Припустимо, що функціональний вид рівняння регресії відомий

(1)

де- відомі функції вхідних змінних Х1 , Х2 , Х3 ,…, Хn .

Векторє вектором вхідних змінних.

Результати спостережень y1, y2, …, yN - незалежні, нормально розподілені випадкові величини.

Дисперсії

дорівнюють одна одній

.

 

Задача експериментатора полягає в знаходженні оцінок bk коефіцієнтіву рівнянні (1).

Введемо наступні позначення:

-вектор, який визначає набір функцій­ fgk в g-му спостереженні, Т - знак транспонування;

- d мірний вектор шуканих оцінок.

 

. (2)

 

Оцінки компонент вектора можуть бути знайдені методом найменших квадратів, тобто з умови мінімуму суми квадратів відхилень спостережуваної величини yjвід величини, передбаченою рівнянням (1)

(3)

Диференціюючи (3) по параметрах bk і дорівнюючи похідні нулеві, одержимо систему нормальних рівнянь, що записується [1] так:

 

(4)

 

 

де

 

(5)

 

матриця коефіцієнтів системи (4), елементи якої знаходять з виразу (6)

. (6)

Вільні члени αk визначаються за виразом

(7)

У матричній формі система нормальних рівнянь запишеться так:

(8)

Рішенням системи (8) є вектор оцінок коефіцієнтів

. (9)

Запишемо вирази для коваріаційної матриці оцінок bk . Нагадаємо, що ця матриця складається з елементів, що представляють собою дисперсії і коваріації оцінок коефіцієнтів, тобто

(10)

де βk, βf - справжні значення коефіцієнтів.

Коваріаційна матриця з врахуванням (9) і

(11)

запишеться в такий спосіб:

. (12)

 

в силу того, що помилки некоррельовані; тут Е - одинична матриця розміру N´N ).

План X, який мінімізує визначник коваріаційної матриці оцінок (12) на безлічі всіх планів в області G, називається D-оптимальним.

, (13)

де .

Пояснимо, як треба розуміти критерій D-оптимальності. Виявилося, що D-оптимальний план мінімізує об‘єм довірчого еліпсоїда на безлічі всіх планів в області G. Довірчий еліпсоїд - це такий еліпсоїд, що накриває справжні значення коефіцієнтів з даним рівнем імовірності. Оскільки об‘єм цього еліпсоїда V пропорційний , то мінімізація цього визначника по безлічі планів в області G забезпечить мінімальний об‘єм.

Наведемо ще кілька критеріїв оптимальності:

1. А-оптимальність. План називається А-оптимальним, якщо його коваріаційна матриця має мінімальний слід (тобто суму діагональних елементів). Це відповідає мінімумові середньої дисперсії оцінок параметрів.

2. Е-оптимальность. План називається Е-оптимальним, якщо він мінімізує максимальне власне число коваріаційної матриці оцінок .

3. G-оптимальність. План називається G-оптимальним, якщо він забезпечує найменшу за всіма планами величину максимальної дисперсії передвіщених значень рівняння регресії.

4. План, мінімізуючий максимальний діагональний елемент коваріаційної матриці (тобто максимальну дисперсію оцінок параметрів).

Усі наведені критерії були сформульовані для точних планів, тобто для планів з фіксованою кількістю спостережень N.

Розглянемо тепер методи побудови D оптимальних планів.

При побудові D -оптимальних планів можливі дві постановки задачі. При першій з них задається кінцева кількість N спостережень і шукається таке розташування експериментальних точок, при якому буде виконана умова (13). Отримані в такий спосіб D-оптимальні плани називаються точними. Якщо ці плани концентруються в h£ N точках, в кожній з яких кількість вимірів дорівнює N×L то частота повторень спостережень у l-ній точці буде . Тому . Основна властивість, яка характеризує точні плани, це те, що Nt - ціле число.

Можлива й інша постановка задачі. Вона зв'язана з поняттям узагальненого плану. Узагальненим (або безперервним) планом називається сукупність 2h чисел

(15)

.

Де - точки, в яких проводяться спостереження, а Wl - частка спостережень в даній точці при загальній кількості спостережень, прийнятій за одиницю.

В даному випадку

але - це будь-які дійсні числа, у тому числі й ірраціональні. Отже, такі плани не зв'язані з якоюсь конкретною кількістю спостережень.

Безперервні плани - це математична абстракція, що необхідна для спрощення задачі побудови D-оптимальних планів. Виявилося, що безперервні D-оптимальні плани можуть бути побудовані аналітично для деяких видів рівняння регресії.

Для безперервних D-оптимальних планів була сформульована і доведена теорема еквівалентності, відповідно до якої безперервний D-оптимальний план є одночасно і G-оптимальним, тобто мінімізує , причому

, (16)

де k - кількість коефіцієнтів регресії;

N - кількість точок експериментального плану. Рівняння (16) дозволяє оцінювати відхилення даного плану від D-оптимального. Відносне відхилення можна оцінити за формулою:

. (17)

 

На основі теореми еквівалентності була створена розрахункова процедура, яка дозволяє будувати безперервні D-оптимальні плани для довільного виду рівняння регресії і довільної форми області планування G.

Надалі будемо розглядати лише безперервні D-оптимальні плани. При реалізації безперервних D-оптимальних планів на практиці застосовується послідовна стратегія експериментування, при якій точка постановки нового експерименту визначається, виходячи з результатів попередніх експериментів.

При цьому виникають дві основні проблеми:

- доцільність продовження експерименту для уточнення оцінок параметрів;

- вибір наступної експериментальної точки з точок D-оптимального плану, якщо прийнято рішення про продовження експерименту.

Послідовний D-оптимальний експеримент організується так:

- вибирається початковий план, що представляє собою підмножину точок

D-оптимального плану;

- перевіряється виконання умови припинення експериментування (як буде

показано нижче, момент припинення не залежить від результатів експерименту yg );

- якщо не прийняте рішення про припинення спостережень, то вибирається

найкраща точка постановки наступного експерименту.

Розглянемо реалізацію правила припинення. Будемо вважати, що нам дана допустима точність визначення оцінок :

 

(18)

 

де — оцінка після D-спостережень, яка повинна бути забезпечена з деякою заданою імовірністю. Умова (18) означає, що точка дійсних значень коефіцієнтів з імовірністю Р знаходиться в середині сфери радіуса r з центром у точці Область у просторі параметрів, обмежену сферою (18), позначимо через WN і назвемо її допустимою. Спостереження припиняються, коли N досягне такого значення, при якому

. (19)

Скористаємося поняттям довірчого еліпсоїда. Довірчий еліпсоїд визначає область у просторі , яка накриває вектор дійсних значень параметрівз імовірністю P. Рівняння довірчого еліпсоїда записується так:

, (20)

де - відсоткова точка розподілу s2 для кількості ступенів свободи k.

Умова припинення (19) буде виконана, якщо довірчий еліпсоїд знаходиться в середині сфери (18), яка визначає допустиму область.

Це буде матиме, коли

, (21)

де lN, min - мінімальне власне число матриці .

Отже, спостереження припиняються, як тільки виконується нерівність (21). Очевидно, що виконання умови (21) не залежить від результатів експерименту. Якщо умова припинення (21) не виконана, необхідно продовжити експеримент. Для вибору наступної експериментальної точки необхідно знайти максимальне значення дисперсії пророкування (14) по точках плану. Точка максимуму і є точкою постановки нового експерименту. Алгоритм вибору наступної експериментальної точки, заснований на процедурі послідовного планування експериментів Соколова. Вибір точки також не зв'язаний з результатами попередніх експериментів (тому що не залежить від yg ), тому і порядок проходження точок, і мінімальні власні числа матриці можуть бути визначені до початку експерименту. Спочатку визначається порядок проходження точок D-оптимального плану, а потім обчислюється lN,min після кожного нового спостереження.

Маючи таку таблицю, яка містить точки плану і lN,min можна визначити по (17) границю припиненняі визначити заздалегідь кількість спостережень, які потрібно буде зробити.

 

Таблиця 1 - lN,min і d після кожного спостереження

Х1 Х2 lmin d
- -
- -
-1 - -
- -
- -
-1 - -
-1 - -
-1 - -
-1 -1 1,000 0,667
-1 1,031 0,833
1,067 0,590
-1 -1 1,100 0,720
-1 1,138 0,234
1,717 0,115
-1 1,744 0,168
1,762 0,241
-1 1,781 0,278
-1 1,803 0,346
-1 -1 1,827 0,32
1,985 0,225
-1 2,047 0,254
2,174 0,0925
-1 2,199 0,14
2,225 0,183
-1 -1 2,250 0,231
-1 2,277 0,1925
2,860 0,0733
2,919 0,0923
-1 3,024 0,095
-1 3,041 0,116
-1 -1 3,067 0,152
3,092 0,166
-1 3,130 0,145
-1 3,206 0,167
3,321 0,068
3,892 0,0668
-1 3,918 0,0957
3,945 0,1245
-1 -1 3,972 0,153
-1 4,000 0,066
-1 4,071 0,078

Продовження таблиці 1.

 

4,174 0,0557
4,249 0,0707
-1 4,349 0,0725
-1 4,377 0,0933
4,406 0,1147
-1 -1 4,434 0,1384
-1 4,464 0,0886
5,039 0,0367
-1 5,063 0,0574
-1 -1 5,078 0,0764
5,089 0,0971
-1 5,105 0,0575
5,216 0,0689
5,295 0,0509
-1 5,378 0,0631
-1 5,498 0,043
-1 5,524 0,06
-1 -1 5,551 0,077
5,557 0,095
-1 5,604 0,1005
6,182 0,0196
-1 6,206 0,0375
6,230 0,051
-1 -1 6,254 0,067
-1 6,278 0,0687
6,860 0,0517

Для визначення звичайно проводиться попередній експеримент, який містить невелику кількість точок D-оптимального плану (N0 спостережень) і визначаються оцінки коефіцієнтів регресії Після цього береться, як деякий відсоток величини .

Відзначимо, що ортогональні плани типу 2n є D-оптимальними. Таким чином, у випадку рівняння регресії виду

, i ¹ k ¹ l ¹ q. (22)

можна використовувати блоки експериментів, кожний з яких представляє повний факторний експеримент або дробовий факторний експеримент. Можна показати, що після кожного такого блоку

, (23)

де v - кількість блоків;

n - кількість спостережень у блоці.

 

Відзначимо, що після визначення кількості спостережень порядок їхнього проведення не має значення.

У таблиці 1 приведений D -оптимальний план для рівняння

. (24)

Цей план складається з 9 дослідів (перші 9 точок таблиці). Послідовність проведення експериментів після перших 9 дослідів визначалася за допомогою обчислення максимального значення (14) на кожному крокові і додавання точки, у якій досягається цей максимум.

В таблиці приведені також lN,min і d після кожного спостереження.