Зависимость между X и Y, если она сущест­вует, называют корреляционной или просто корреляцией.

Пример: в таблице представлены данные изме­рения массы и роста мужчин 20 - 25 лет (xi и уi - среднее значение ин­тервалов).

Корреляционная зависимость между ростом и весом в дан­ном примере, если она существует, может быть выражена графи­чески. Для этого определяют среднее значение X для каждого Y и среднее значение Y для каждого X по формулам:

X = ∑xi n/n` , Y = ∑yini/n``

По данным расчета на графике наносят точки и проводят ли­нии, наиболее близко прилежащие к этим точкам. Та­кие линии называются линиями регрессии. По этим линиям можно качественно оценить зависимость между изучаемыми ве­личинами.

 

По их форме можно судить о виде корреляции. В нашем при­мере графиком являются прямые линии. В этом случае говорят о линейной корреляционной зависимости. Линейная корре­ляция яв­ляется самым простым видом зависимо­сти между случайными ве­личинами. Пользуясь специальным математическим аппаратом, можно найти уравнение линий регрессии. В нашем примере: у = b0 + b1х, где b0 и b1 определяются по экспериментальным данным. По расположению этих линий можно судить об отсутствии или наличии связи между изучаемыми признаками. Если линии регрессии перпендикулярны, то связь между величинами полностью исключа­ется. Чем меньше угол между ли­ниями регрес­сии, тем с большим основанием можно говорить о нали­чии такой связи. Если ли­нии регрессии совпадают или параллельны, то связь является функциональной. Количественная оцен­ка корреляции между признаками требует довольно сложных и громоздких математических вычис­лений и не входит в нашу программу. Использу­ется, так называемый коэф­фициент корреляции, который количественно определяет зависи­мость между величинами. Среди методов статистиче­ской обработки экспериментальных данных особо следует выделить дисперсионный анализ. Эта осо­бенность заключается в том, что любая биологическая система представляет собой сложнейший материальный объект, на каж­дый элемент которого действует много факторов внешнего и внутреннего порядка. Характери­стики распределения случайной величины, такие как математическое ожидание и дисперсия не от­ражают влияние отдельных факторов. Основной задачей диспер­сионного анализа и является определение достоверности влияния какого-либо фактора на процессы, происходящие в системе. Не вдаваясь в математические подробности, рассмотрим сущность дисперсионного анализа на конкретном примере. В таблице приведены экспериментальные данные серии опытов по изуче­нию условного рефлекса у 5 собак.

 

Определялось время(в секундах) с момента действия раздражи­теля до начала выделения слюны. Требуется определить: влияют ли индивидуальные особенности животных на условный рефлекс. Из таблицы видно, что вариабельность среднего значения па­раметра времени у каждой собаки довольно большая.

В таблице определена дисперсия математиче­ского ожи­дания параметра времени по индиви­дуальным особенностям животных.

 

Теперь осталось сравнить дисперсию математи­ческого ожида­ния по каждой собаке с общей дисперсией всех опытов по одно­му из критериев различия. В приведенном примере с помощью критерия Фишера было выявлено, что индивиду­альные особенности не влияют на значе­ние вариации времени выработки условного реф­лекса. Указанная схема расчета носит название - однофакторный дисперсионный анализ. Диспер­сионный анализ позволяет также подтвер­дить(или опровергнуть) гипотезу об одновре­менном влиянии двух, трех и более факторов на вариабельность изучаемого признака — это многофакторный дисперсионный анализ. Ситуация использова­ния дисперсионного анализа постоянно возникает в медицине в диагностическом и лечебном процессе при выявлении наиболее эффективных причин заболеваний и методов их лечения. При построе­нии экспериментальных графиков точки, ввиду случайности выборки, как правило, не лежат на одной линии. Су­ществуют определенные правила, которые позволяют провести экс­периментальную линию, наиболее близко к построенным точкам.