Щоб мати можливість оцінити вплив кожного фактора на вихідний параметр і порівняти вплив різних факторів, визначимо деякий показник цього впливу.
Нехай за відсутності помилок досліду при варіюванні фактора х на різних рівнях отримані фактичні значення вихідного параметру у. Тоді в якості показника впливу фактора х приймаємо величину, яку називають, по аналогії з звичайною, дисперсією фактора х, тобто
(1)
де
.
При цьому треба мати на увазі, що числа уі не є випадковими і тому дисперсія не пов‘язана ні з якою випадковою величиною, так як ми припускаємо, що .
Вивчати вплив факторів по величинам їх дисперсій зручно, оскільки це простіша міра розсіювання, і до того ж аналогічна мірі впливу фактора випадкових причин, тобто аналогічна дисперсії одиничного спостереження (відтворення) . Завдяки цьому є можливість порівнювати вплив будь-якого досліджуваного і випадкового факторів. Таке дослідження факторів по їх дисперсіях називається дисперсійним аналізом. Цей аналіз був введений в 20-х роках нашого сторіччя Р.А. Фішером і розвинений Йєйтсом.
Розглянемо ідею дисперсійного аналізу на прикладі вивчення впливу одного фактора на фоні випадкових похибок, коли дисперсія відтворення відома. При варіюванні фактора х на u рівнях в результаті спостережень отримаємо значення , розсіювання яких можна характеризувати вибірковою дисперсією:
(2)
з числом мір свободи .
Якщо різниця між s2 і σ2 не значна, то з цього випливає, що розкид спостережень, який зумовлений цією різницею, зв‘язаний лише з випадковими причинами. Тому вплив фактора х незначний, якщо різниця між s2 і σ2 значна, то підвищений розкид спостережень викликаний не лише випадковими причинами. Цей розкид спостережень також викликаний впливом фактора х, який тепер необхідно визначити суттєвим.
Оскільки в останньому випадку додаються впливи двох незалежних факторів - випадкових причин (з дисперсією s2) і фактора х (з дисперсією sх2), що призводить до загального розсіювання спостережень, то загальна дисперсія буду сумою двох указаних , а її оцінка буде
. (3)
Тому дисперсія фактора визначається виразом
(4)
В загальному випадку, коли дисперсія відтворення s2 невідома, схема дисперсійного аналізу повинна дозволити знайти її оцінку поряд з оцінками дисперсій досліджуваних факторів. З цією метою планується проведення серій дублюючих дослідів при кожному з усіх можливих сполучень рівнів досліджуваних факторів.
Таким чином, основна ідея дисперсійного аналізу полягає в розкладенні загальної дисперсії s2 на складові, які залежать від випадкових причин, від кожного з розглянутих факторів і по їх взаємодії окремо, а також в оцінці статистичної значимості дисперсій останніх з урахуванням похибки відтворення досліду.
Розглянемо лише найпростіші способи застосування дисперсійного аналізу, техніка проведення якого доволі різноманітна.