Коэффициенты корреляции рангов

437

Примущество коэффициента корреляции рангов состоит в том, что ранжировать можно и по таким признакам, которые нельзя выразить численно: можно проранжировать кандидатов на занятие определенной должности по профессиональному уровню, по умению руководить коллективом, по личному обаянию и т.п. При экспертных оценках можно ранжировать оценки разных экспертов и найти их корреляции друг с другом, чтобы затем исключить из рассмотрения оценки эксперта, слабо коррелированные с оценками других экспертов. Коэффициент корреляции рангов применяется для оценки устойчивости тенденции динамики (см. подразд. 12.9).

Недостатком коэффициента корреляции рангов является то, что одинаковым разностям рангов могут соответствовать совершенно отличные разности значений признаков (в случае количественных признаков). Поэтому для последних следует считать корреляцию рангов, как и коэффициент знаков Фехнера, приближенными мерами тесноты связи, обладаю-щими меньшей информативностью, чем коэффициент корреляции числовых значений признаков.

Рассчитаем коэффициент корреляции рангов по данным табл. 11.11, Ранги присвоены в соответствии со значениями переменных (см. табл. 9.1).

439

440

Вычислим коэффициент корреляции рангов Кендэла по Данным табл. 11.12.

Таблица 11.12 Ранжирование данных по переменным х и у

Значениям каждой переменной приписываются ранги. Ранг 1 устанавливается наименее важному значению: минимальному — для стимулянт, т.е. для переменных типа «чем больше, тем лучше», и максимальному для дестимулянт, т.е.

 

для переменных типа «чем больше, тем хуже». Если нельзя отдать предпочтение нескольким объектам, то каждому из них присваивается средний ранг, определяемый как средний арифметический из суммы соответствующих мест («связанные ранги»). Скажем, если нельзя отдать предпочтение второму, третьему и четвертому объектам, то каждому из этих

442

Таблица 11.13 Расчет коэффициента конкордации

 

РЕЗЮМЕ

 

Способы измерения связей между признаками зависят от того, по какой шкале они измерены: номинальной, порядковой, интервальной или шкале отношений.

В собираемых статистических данных непрерывно возрастает доля нечисловой информации. Это объясняется несколькими причинами:

Измерение связи между неколичественными переменными основано на таблице сопряженности — двух- или трехмерном распределении единиц совокупности. Если переменные дихотомические, то данные представляются в таблице 2x2 и вычисляются специальные меры связи: коэффициенты ассоциации, коэффициенты контингенции.

По таблицам сопряженности т х р вычисляются коэффициенты взаимной сопряженности, основанные на тестовой статистике хи-квадрата.

В случае, если нельзя выполнить условия применения статистики хи-квадрат, рекомендуется пользоваться теоретико-информационными мерами связей, основанными на измерении энтропии распределений и количества информации. В качестве мер связей между номинальными переменными используются меры связи: Х-Гутмана, т-Гудмена и Краскала и др.

Корреляция между порядковыми переменными измеряется коэффициентом ранговой корреляции. Широко распространены коэффициенты ранговой корреляции Спирмена и Кендэла. Меры связей между неколичественными переменными применяются при обработке данных экспертных опросов. Если экспертам нужно оценить объект не по одному, а по нескольким свойствам, то используется коэффициент конкордации.