Однофакторный дисперсионный анализ

 

В данной теме будет рассмотрен только однофакторный дисперсионный анализ, используемый для несвязанных выборок. Оперируя как основным понятием дисперсии, этот анализ базируется на расчете дисперсий трех типов:

• общая дисперсия, вычисленная по всей совокупности экспериментальных данных;

• внутригрупповая дисперсия, характеризующая вариативность признака в каждой выборке;

• межгрупповая дисперсия, характеризующая вариативность групповых средних.

Основное положение дисперсионного анализа гласит: общая дисперсия равна сумме внутригрупповой и межгруппповой дисперсий.

Это положение можно записать в виде уравнения:

где хij — значения всех переменных, полученных в эксперименте; при этом индекс j меняется от 1 до р, где р — число сравниваемых выборок, их может быть три и больше; индекс i соответствует числу элементов в выборке (их может быть два и больше);

— общая средняя всей анализируемой совокупности данных;

— средняя j выборки;

N — общее число всех элементов в анализируемой совокупности экспериментальных данных;

р — число экспериментальных выборок.

 

Проанализируем это уравнение более подробно.

Пусть у нас имеется р групп (выборок). В дисперсионном анализе каждую выборку представляют в виде одного столбца (или строки) чисел. Тогда, для того чтобы можно было указать на конкретную группу (выборку), вводится индекс j, который меняется соответственно от j = 1 до j = р. Например, если у нас 5 групп (выборок), то р=5, а индекс j меняется соответственно от j= 1 до j= 5.

Пусть перед нами стоит задача — указать конкретный элемент (значение измерения) какой-либо выборки. Для этого мы должны знать номер этой выборки, например 4, и расположение элемента (измеренного значения) в этой выборке. Этот элемент может располагаться в выборке начиная с первого значения (первая строчка) до последнего (последняя строчка). Пусть наш искомый элемент расположен на пятой строчке. Тогда его обо значение будет таково: х54. Это значит, что выбран пятый элемент в строчке из четвертой выборки.

В общем случае в каждой группе (выборке) число составляющих ее элементов может быть различным — поэтому обозначим число элементов в j группе (выборке) через nj. Полученные в эксперименте значения признака в j группе обозначим через хij, где i = 1, 2, ... n — порядковый номер наблюдения в j группе.

Дальнейшие рассуждения целесообразно проводить с опорой на таблицу 35. Отметим, однако, что для удобства дальнейших рассуждений, выборки в этой таблице представлены не как столбцы, а как строчки (что, однако, не принципиально).

В итоговой, последней строке таблицы даны: общий объем всей выборки — N, сумма всех полученных значений G и общая средняя всей выборки . Эта общая средняя получена как сумма всех элементов анализируемой совокупности экспериментальных данных, обозначенная выше как G, деленная на число всех элементов N.

В крайнем правом столбце таблицы представлены величины средних по всем выборкам. Например, в j выборке (строчка таблицы обозначенная символом j) величина средней (по всей j выборке) такова:

Таблица 35

  Номер выборки Полученные значения признака Число элементов в каждой выборке Сумма всех элементов выборки Средняя по выборке
Х11, х21…, хn11 n1 Sxi1 = T1
….. ….. ….. ….. …..
j х1j, х2j, хni,j nj Sxij = Tj
….. ….. ….. ….. …..
p Х1p, х2p…, хnp,p np ip = Tp
Итого   N = Snj SSxij = G

 

Для расчета по методу однофакторного дисперсионного анализа, согласно уравнению рассмотренному выше, необходимо определить две дисперсии: межгрупповую (дисперсию групповых средних) и внутригрупповую, поскольку общая дисперсия всей выборки является суммой этих дисперсий.

Считается, что межгрупповая дисперсия обусловлена влиянием изучаемого фактора, а величина внутригрупповой дисперсии рассматривается как случайная.

Подчеркнем, однако, что при расчетах по методу однофакторного дисперсионного анализа, вначале подсчитываются не дисперсии, а квадраты отклонений (которые представлены в числителях всех трех членов рассмотренной выше основной формулы дисперсионного анализа) и лишь в заключительной части расчетов они делятся на соответствующие величины для получения дисперсий и их дальнейшего сравнения.

Таким образом, в терминах квадратов отклонений основное уравнение однофакторного дисперсионного анализа можно переписать так: