Проверка гипотез о законе распределения ген.совокупности.

КРИТЕРИЙ СОГЛАСИЯ – статистическое правило, в соответствии с которым проверяется статистическая гипотеза об аналитическом виде закона распределения вероятностей анализируемой генеральной совокупности, причем гипотеза может как однозначно задавать закон распределения, так и определять лишь его тип.

Закон распределения случайной величины F(x), построенный на основе наблюдений, имеющихся в распоряжении исследователя, называется эмпирическим. Закон распределения , на соответствие которому проверяется эмпирическое распределение, называется гипотетическим. Задача критерия – проверить согласие эмпирического и гипотетического законов распределения.

При проверке рассматриваются две гипотезы. Нулевая гипотеза Н0 утверждает, что различие между эмпирическим и гипотетическим распределением значимо. Альтернативная гипотеза предполагает отсутствие значимых отличий, т.е. ряд наблюдений х1, х2, …, хn образует случайную выборку, извлеченную из генеральной совокупности Х с функцией распределения F(x)=F(x;θ12,…,θk), где общий вид функции F(x) считается известным, а параметры θ12,…,θk могут быть как известными, так и неизвестными.

Критерий согласия основан на использовании различных мер расстояний между анализируемой эмпирической функцией распределения, определенной по выборке, и гипотетической функцией распределения F(x) генеральной совокупности Х. Критерий состоит в том, что выбирается некоторая случайная величина (статистика) Tn, являющаяся мерой расхождения (рассогла­сования) между рядом наблюдений и гипотетическим распределением. Случайная величина Tn, есть функция наблюдаемых относитель­ных частот, и в зависимости от вида этой функции распределение Tn будет задавать соответствующий критерий согласия.

Для заданного уровня значи­мости α на основании закона рас­пределения Tn, определяют критическое значение Tn кр так, что P(Tn > Tn кр) = α. Для выборки х1, х2, …, хn вычисляется наблюдаемая величина Tn набл. Если Tn набл > Tn кр, то нулевая гипотеза отвергается. Если же Tn набл ≤ Tn кр, то нулевая гипотеза не отвергается: в этом слу­чае отклонения от гипотетического закона распреде­ления считаются незначимыми, т.е. данные наблюдения не противоречат гипотезе о виде распределения.

Можно осуществлять проверку гипотезы о виде распределения с помощью критерия согласия и в другом порядке. По наблюдаемому значению (Tn набл) определить вероятность αнабл = P(Tn >Tn набл). Если αнабл ≤ α, то отклонения значимы, т.е. гипотеза отвергается, если же αнабл > α, то гипотеза не отвергается. Важно отметить, что значения αнабл, достаточно близкие к единице, указывают на нерепрезентативность выборки; выборку сле­дует повторить, соблюдая принцип случайности отбора.

Задача проверки соответствия эмпирических распределений гипотетическим часто является предварительным этапом более сложных статистических процедур, например исследования взаимосвязи между показателями. Выдвижение гипотезы о соответствии эмпирического распределения анализируемой случайной величины некоторому известному закону, эквивалентно выбору модели порождения данных исследуемого процесса, которая является отправной точкой любого статистического исследования, т.к. определяет методы доступные для анализа. Например, многие статистические методы анализа исходят из предположения о нормальности распределения исследуемых величин (линейная и логистическая регрессия, байесовская классификация и т.д.), так что для их применения необходимо предварительно обосновать согласованность закона распределения показателей с нормальным