Ідея дисперсійного аналізу

Щоб мати можливість оцінити вплив кожного фактора на вихідний параметр і порівняти вплив різних факторів, визначимо деякий показник цього впливу.

Нехай за відсутності помилок досліду при варіюванні фактора х на різних рівнях отримані фактичні значення вихідного параметру у. Тоді в якості показника впливу фактора х приймаємо величину, яку називають, по аналогії з звичайною, дисперсією фактора х, тобто

(1)

де

При цьому треба мати на увазі, що числа у_і не є випадковими і тому дисперсія не пов‘язана ні з якою випадковою величиною, так як ми припускаємо, що .

Вивчати вплив факторів по величинам їх дисперсій зручно, оскільки це простіша міра розсіювання, і до того ж аналогічна мірі впливу фактора випадкових причин, тобто аналогічна дисперсії одиничного спостереження (відтворення) . Завдяки цьому є можливість порівнювати вплив будь-якого досліджуваного і випадкового факторів. Таке дослідження факторів по їх дисперсіях називається дисперсійним аналізом. Цей аналіз був введений в 20-х роках нашого сторіччя Р.А. Фішером і розвинений Йєйтсом.

Розглянемо ідею дисперсійного аналізу на прикладі вивчення впливу одного фактора на фоні випадкових похибок, коли дисперсія відтворення відома. При варіюванні фактора х на u рівнях в результаті спостережень отримаємо значення , розсіювання яких можна характеризувати вибірковою дисперсією:

(2)

з числом мір свободи .

Якщо різниця між s²і σ² не значна, то з цього випливає, що розкид спостережень, який зумовлений цією різницею, зв‘язаний лише з випадковими причинами. Тому вплив фактора х незначний, якщо різниця між s²і σ² значна, то підвищений розкид спостережень викликаний не лише випадковими причинами. Цей розкид спостережень також викликаний впливом фактора х, який тепер необхідно визначити суттєвим.

Оскільки в останньому випадку додаються впливи двох незалежних факторів - випадкових причин (з дисперсією s²) і фактора х (з дисперсією s_х²), що призводить до загального розсіювання спостережень, то загальна дисперсія буду сумою двох указаних , а її оцінка буде

. (3)

Тому дисперсія фактора визначається виразом

(4)

В загальному випадку, коли дисперсія відтворення s²невідома, схема дисперсійного аналізу повинна дозволити знайти її оцінку поряд з оцінками дисперсій досліджуваних факторів. З цією метою планується проведення серій дублюючих дослідів при кожному з усіх можливих сполучень рівнів досліджуваних факторів.

Таким чином, основна ідея дисперсійного аналізу полягає в розкладенні загальної дисперсії s²на складові, які залежать від випадкових причин, від кожного з розглянутих факторів і по їх взаємодії окремо, а також в оцінці статистичної значимості дисперсій останніх з урахуванням похибки відтворення досліду.

Розглянемо лише найпростіші способи застосування дисперсійного аналізу, техніка проведення якого доволі різноманітна.