Пп. 2. Критерий Стьюдента.

 

Для определения достоверности разницы средних для двух выборок применяют метод (критерий) Стьюдента или t - критерий. Этот критерий применяется к зависимым выборкам, например, результаты одной и той же группы испытуемых до и после воздействия независимой переменной.

Пусть случайная величина Х имеет нормированное нормальное распределение, то есть М(Х) = 0, σХ = 1.

Определение 53.Распределением Стьюдентас n-1 степенью свободы называется распределение случайной величины , где , , где Х подчинена нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице. Это распределение характеризуется плотностью , где Г(х) – известная гамма-функция . Число степеней свободы -число данных из выборки, значения которых могут быть случайными, то есть могут варьироваться.
Для распределения Стьюдентасоставлены специальные таблицы.

По-другому, критерий Стьюдента - метод проверки однородности двух независимых выборок (то есть нет различий). В математико-статистических терминах постановка задачи такова: имеются две выборки x1, x2,..., xm и y1, y2,...,yn (т. е. наборы из m и n действительных чисел), требуется проверить их однородность. Можно переформулировать задачу: требуется проверить, есть ли различие между выборками. Если различия нет, то для дальнейшего изучения часто выборки объединяют.

Опишем традиционный статистический метод проверки однородности. Вычисляют средние арифметические в каждой выборке: , , затем выборочные дисперсии: , , затем статистику t, на основе которой принимают решение:

.

По заданному уровню значимости a и числу степеней свободы (m+n - 2) из таблиц распределения Стьюдента находят критическое значение tкр. Если |t| > tкр, то гипотезу однородности (отсутствия различия) отклоняют, если же |t| < tкр, то принимают. (При односторонних альтернативных гипотезах вместо условия |t| > tкр проверяют, что t > tкр; эту постановку рассматривать не будем, так как в ней нет принципиальных отличий от обсуждаемой нами.)

Замечание 1. Для обоснованного применения математико-статистических методов необходимо, прежде всего, построить и обосновать вероятностную модель порождения данных. При проверке однородности двух выборок общепринята модель, в которой x1, x2,..., xm рассматриваются как результаты m независимых наблюдений некоторой случайной величины Х с функцией распределения F(x), неизвестной статистику, а y1, y2,...,yn - как результаты n независимых наблюдений, вообще говоря, другой случайной величины Y с функцией распределения G(у), также неизвестной статистику. Предполагается также, что наблюдения в одной выборке не зависят от наблюдений в другой, поэтому выборки и называют независимыми. Возможность применения модели в конкретной реальной ситуации требует обоснования. Независимость и одинаковая распределенность результатов наблюдений, входящих в выборку, могут быть установлены или исходя из методики проведения конкретных наблюдений, или путем проверки статистических гипотез независимости и одинаковой распределенности с помощью соответствующих критериев. Если проведено (m+n) измерений линейных размеров деталей, то описанную выше модель, как правило, можно применять. Если же, например, xi и yi - результаты наблюдения одного и того же образца до и после определенного технологического воздействия, то рассматриваемую модель применять нельзя.
(В этом случае используют модель так называемых связанных выборок, в которой обычно строят новую выборку zi = xi - yi и используют статистические методы анализа одной выборки, а не двух.)

Замечание 2.Для определения достоверности разницы средних в случае зависимых выборок применяется следующая формула: , где d — разность между результатами в каждой паре; — сумма этих частных разностей; - сумма квадратов частных разностей. Полученные результаты сверяют с таблицей t, отыскивая в ней значения, соответствующие n-1 степени свободы; n — это в данном случае число пар данных.
Перед тем как использовать формулу, необходимо вычислить для каждой группы частные разности между результатами во всех парах, квадрат каждой из этих разностей, сумму этих разностей и сумму их квадратов.