Измерение тесноты связи

Чтобы измерить тесноту прямолинейной связи между двумя признаками, пользуются парным коэффициентом корреляции, который обозначается r

Так как при корреляционной связи имеют дело не с приращением функции в связи с изменением аргумента, а с сопряженной вариацией результативных и факторных признаков, то определение тесноты связи, по существу, сводится к изучению этой сопряженности, т.е. того, в ка­кой мере отклонение от среднего уровня одного признака сопряжено с отклонением другого. Это значит, что при наличии полной прямой связи все значения (х —X) и (у — Y) должны иметь одинаковые знаки, при полной обратной — разные, при частичной связи знаки в преобладающем чис­ле случаев будут совпадать, а при отсутствии связи — совпадать примерно в равном числе случаев.

Для оценки существенности коэффициента корреляции пользуются специально разработанной таблицей критичес­ких значений г.

Коэффициент корреляции rxy. применяется только в тех случаях, когда между явлениями существует прямолиней­ная связь.

(8.16.)

Если же связь криволинейная, то пользуются индексом корреляции, который рассчитывается по форму­ле:


(8.17)

где у — первоначальные значения; — среднее значение; Y — теоретические (выравненные) значения переменной величины.

Показатель остаточной, случайной дисперсии опреде­ляется по формуле:


(8.18)

Она характеризует размер отклонений эмпирических значений результативного признака y от теоретических Y, т.е. случайную вариацию.

Общая дисперсия


(8.19)

 
 

характеризует размер отклонений эмпирических значений результативного признака у от , т.е. общую вариацию. Отношение случайной дисперсии к общей характеризует долю случайной вариации в общей вариации, а

(8.20.)

есть не что иное, как доля факторной вариации

 
 

(8.21)

в общей, потому что по правилу сложения дисперсий об­щая дисперсия равна сумме факторной и случайной дис­персий:

s=sY2+s02 (8.22)

Подставим в формулу индекса корреляции соответству­ющие обозначения случайной, общей и факторной дис­персий и получим:

 

 
 

(8.23)


Таким образом, индекс корреляции характеризует долю факторной вариации в общей:

(8.24)

однако с той лишь разницей, что вместо групповых сред­них берутся теоретические значения Y.

Индекс корреляции по своему абсолютному значению колеблется в пределах от 0 до 1. При функциональной зависимости случайная вариация å(y-Y)2=0, индекс корреляции равен 1. При отсутствии связи R = 0, потому что Y = у.

Коэффициент корреляции является мерой тесноты связи только для линейной формы связи, а индекс корреля­ции — и для линейной, и для криволинейной. При прямо­линейной связи коэффициент корреляции по своей абсо­лютной величине равен индексу корреляции:

(8.25)

 

Если индекс корреляции возвести в квадрат, то полу­чим коэффициент детерминации

(8.26)

Он характеризует роль факторной вариации в общей вариации и по построению аналогичен корреляционному отношению η2. Как и корреляционное отношение, коэф­фициент детерминации R2 может быть исчислен при по­мощи дисперсионного анализа, так как дисперсионный анализ позволяет расчленить общую дисперсию на фак­торную и случайную. Однако при дисперсионном анализе для разложения дисперсии пользуются методом группи­ровок, а при корреляционном анализе — корреляционны­ми уравнениями.

Коэффициент детерминации является наиболее конк­ретным показателем, так как он отвечает на вопрос о том, какая доля в общем результате зависит от фактора, поло­женного в основание группировки.

При прямолинейной парной связи факторную диспер­сию можно определить без вычисления теоретических зна­чений Y по следующей формуле:

(8.27)

5. Множественная корреляция

До сих пор мы рассматривали корреляционные связи между двумя признаками: результативным (у) и фактор­ным (х). Например, выпуск продукции зависит не только от размера основного капитала, но и от уровня квалифи­кации рабочих, состояния оборудования, обеспеченности и качества сырья и материалов, организации труда и т.д. В связи с этим возникает необходимость в изучении, из­мерении связи между результативным признаком, двумя и более факторными. Этим занимается множественная корреляция.

Множественная корреляция решает три задачи. Она определяет:

1) форму связи;

2) тесноту связи;

3) влияние отдельных факторов на общий результат.

Определение формы свя­зи сводится обычно к отысканию уравнения связи у с фак­торами x,z,w,...у. Так, линейное уравнение зависимости результативного признака от двух факторных определяет­ся по формуле

(8.28)

Для определения параметров а0, а} и а2, по способу наименьших квадратов необходимо решить следующую систему трех нормальных уравнений:

(8.29.)

При определении тесноты связи для множественной зависимости пользуются коэф­фициентом множественной (совокупной) корреляции, предварительно исчислив коэффициенты парной корреля­ции. Так, при изучении связи между результативным признаком у и двумя факторными признаками — х и z, нужно предварительно определить тесноту связи между у и х, между у и z, т.е. вычислить коэффициенты парной кор­реляции, а затем для определения тесноты связи резуль­тативного признака от двух факторных исчислить коэф­фициент множественной корреляции по следующей фор­муле:

(8.30.)

где rxy, rzy, rxz парные коэффициенты корреляции.

Коэффициент множественной корреляции колеблется в пределах от 0 до 1. Чем он ближе к 1, тем в большей мере учтены факторы, определяющие конечный резуль­тат.

Если коэффициент множественной корреляции возве­сти в квадрат, то получим совокупный коэффициент де­терминации, который характеризует долю вариации резуль­тативного признака у под воздействием всех изучаемых факторных признаков.

Совокупный коэффициент детерминации, как и при парной корреляции, можно исчислить по следующей фор­муле:

(8.31)

где — дисперсия факторных признаков, — диспер­сия результативного признака. Однако вычисление теоретических значений Y при множественной корреляции и сложно, и громоздко. Поэтому факторную дисперсию исчисляют по следующей формуле:

(8.32)

 

Проверка существенности связи при множественной корреляции, по сути, ничем не отличается от проверки при парной корреляции.

Поскольку факторные признаки действуют не изоли­рованно, а во взаимосвязи, то может возникнуть задача определения тесноты связи между результативным при­знаком и одним из факторных при постоянных значениях прочих факторов. Она решается при помощи частных ко­эффициентов корреляции. Например, при линейной связи частный коэффициент корреляции между х и у при по­стоянном z рассчитывается по следующей формуле:

(8.33)

В настоящее время на практике широкое распростра­нение получил многофакторный корреляционный анализ.