Сущность выборочного метода

При рассмотрении обобщённой модели обработки экспериментальных данных отмечалось, что пространство наблюдений {} представляет собой множество реализаций вектора , или выборочное множество. Остановимся подробнее на понятии выборки, так как оно играет фундаментальную роль в статистических методах обработки информации как параметрических, так и непараметрических.

При экспериментальных исследованиях закономерностей в массовых случайных явлениях предполагается, что опыты могут быть повторены большое число раз при одинаковых условиях. В каждом опыте регистрируется определённый признак изучаемого объекта. Различают общий и основной признаки. Общим признаком называется свойство, по которому объекты объединяются в однородные совокупности, а основным признаком– свойство объектов, исследуемое в данном эксперименте. Под однородной будем понимать совокупность, все элементы которой являются реализациями одной и той же случайной величины (функции) с одним и тем же законом распределения.

Если производится исследование веса совокупности однотипных деталей (например, гаек), то тип деталей (гайки) характеризует их общий признак, а вес деталей – основной признак.

Отдельное конкретное значение наблюдаемого основного признака называется его реализацией или вариантом. При статистическом исследовании вероятностных свойств совокупности объектов нет возможности производить опыты над каждым из них. Так, при изучении роста ежемесячных доходов граждан РФ невозможно установить доход каждого гражданина за ограниченное время. Для определения всхожести зерновых перед посевной бессмысленно пытаться обследовать каждое отдельное зерно. Всё же, несмотря на это, существует метод, который позволяет изучить интересующие свойства всей совокупности объектов. Речь идёт о выборочном методе, согласно которому основные признаки совокупности объектов изучаются по некоторой её части, называемой выборкой. Более строго в математической статистике выборкой называют совокупность наблюдаемых реализаций основного признака.

Совокупность всех возможных объектов (вариантов), из которых производится выборка, называется генеральной совокупностью. Следует отметить, что выборка является однородной, если все её элементы извлечены из одной генеральной совокупности.

Обычно предполагается, что выборки формируются при многократной реализации случайного эксперимента, результат которого нельзя заранее точно предсказать. Поэтому такие выборки называются случайными.

Пусть количественно исследуемый основной признак описывается случайной величиной . Допустим, что в процессе эксперимента получена последовательность из n значений x1, x2,…, xn случайной величины . До проведения эксперимента эта последовательность является случайной выборкой и обозначается , ,…,.

Если основой признак наблюдаемого объекта описывается случайной функцией , то в процессе эксперимента получаем конечную совокупность реализаций x1(t), x2(t),…, xn(t), t Î [0; T] случайной функции. Случайная выборка представляет в этом случае последовательность случайных функций , ,…,. Часто выборку целесообразно описывать с помощью n-мерного случайного вектора , компонентами которого являются элементы упорядоченной последовательности , ,…, .

Случайный характер выборки выражается в том, что нельзя заранее предсказать возможные значения её элементов, и любые две последовательности из n наблюдаемых значений в общем случае будут различными. В конкретных прикладных задачах элементы выборок представляют собой реализации случайных величин, т.е. детерминированные величины. Таким образом, априорно (до проведения эксперимента) выборка будет случайной, а апостериорно (после проведения опыта) – неслучайной.

Число n элементов выборки является конечным и называется объёмом выборки. Число элементов генеральной совокупности может быть конечным или бесконечным.

В статистике различают повторные и бесповторные выборки. Выборка называется повторной, если отобранный объект после испытания перед отбором следующего объекта снова возвращается в генеральную совокупность. Выборка называется бесповторной, если отобранный объект после испытания не возвращается в генеральную совокупность.

С позиций теории вероятностей элементы случайной выборки рассматриваются как независимые случайные величины с одной и той же функцией распределения и плотностью распределения . Последнее означает, что для плотности распределения случайного вектора имеет место равенство

.

Далеко не всякая выборка адекватно отражает свойства генеральной совокупности. Убедительный пример: требуется оценить средний рост жителей некоторого города, а в качестве выборки исследователю предлагают городскую баскетбольную команду. Нетрудно понять, насколько будет искажён результат.

Говорят, что выборка должна быть представительной или репрезентативной. Выборка представительна, если все элементы генеральной совокупности имеют одинаковую вероятность быть выбранными. Чтобы обеспечить это, не имея никаких сведений о генеральной совокупности, можно полагаться только на случайность отбора объектов в выборку. Все прочие способы будут необъективными, носящими следы влияния посторонних факторов. И семена для проверки всхожести, и жителей для оценивания среднего роста – всё нужно отбирать совершенно случайным образом. Иное дело, если экспериментатор заранее знает, что генеральная совокупность состоит из нескольких классов, различных по своим характеристикам. При таких условиях выборку лучше делать из каждого класса в отдельности. Например, изучая рост жителей, целесообразно делать отдельную выборку мужчин, отдельную женщин; при этом можно учесть возраст, профессию.

Из случайного характера выборок неопровержимо следует, что любое суждение о генеральной совокупности по выборке само является случайным. Имеется в виду суждение, затрагивающее хотя бы один элемент генеральной совокупности, не попавший в выборку.

А какова же связь между наблюдениями, отбираемыми в состав экспериментальных данных, и выборочным методом? Имеется случайная величина и в результате n независимых испытаний получаются n её допустимых значений. Если все допустимые значения случайной величины считать генеральной совокупностью, то полученные при наблюдениях n значений образуют выборку. По этой выборке изучаются свойства случайной величины . Итак, производство наблюдений является частным случаем выборочного метода, когда в качестве генеральной совокупности берутся все допустимые значения некоторой случайной величины и исследуются свойства этой величины.

Если требуется исследовать несколько основных признаков, например рост и вес жителей города, три размера прямоугольных деталей, то экспериментатор наблюдает векторную случайную величину . При этом выборка ,,…,описывается nq-мерным случайным вектором .

Как уже отмечалось, случайные выборки используются для изучения свойств генеральной совокупности. При этом обычно элементы выборки используются для образования по соответствующим правилам новых случайных величин вида

, j = 1,2,…

которые называются статистиками. Примерами статистик являются выборочная сумма , выборочное среднее и т.д.

Все свойства (характеристики) генеральной совокупности, получаемые на основе выборки, называются выборочными или статистическими (в отличие от теоретических, изучаемых в теории вероятностей). В дальнейшем все выборочные характеристики будут отмечаться индексом *. Так, обозначает статистическую функцию распределения случайной величины ; – статистическое математическое ожидание; – статистическую дисперсию и т.д. Все выборочные характеристики представляют собой функции элементов выборки, т.е. статистики.

В выборочном методе большое внимание уделяется изучению законов распределения различных статистик, статистических рядов. Теоретической основой выборочного метода являются предельные теоремы теории вероятностей, которые приведены в виде, адаптированном к рассматриваемой тематике, в § 2.2.