Сущность ошибок репрезентативности и порядок их расчета

Одним из центральных вопросов по выборочному методу считается теоретический расчет основных статистических характеристик и прежде всего среднего значения признаке в генеральной статистической совокупности. Это означает, что теоретически рассчитанная средняя выборочная величина и другие выборочные характеристики должны лишь минимально отличаться от соответствующих им генеральных статистических характеристик, т.е. выборка всегда должна давать достоверные, надежные, репрезентативные результаты.

Значение средней величины в генеральной совокупности может быть теоретически рассчитано по тайным выборочной статистической совокупности следующим образом:

(7.1)

где - среднее значение признака в генеральной совокупности; - среднее значение признака в выборочной совокупности; Δх - предельная ошибка выборки (предельная погрешность).

Формула 7.1 показывает, что среднее генеральное значение теоретически монет отклоняться от среднего выборочного значения в большую или меньшую сторону на некоторую величину предельной погрешности.

В cвoю очередь, предельную ошибку выборки (Δх) теоретически можно рассчитать по формуле:

(7.2)

гдe t - доверительной коэффициент, зависящими от уровня вероятности Р; Мх — средняя ошибка выборки.

Доверительный коэффициент (t) означает, что по расчетному признаку генеральная совокупность "накрывается" доверительной областью. Он должен быть достаточно большим, т.е. отвечать принципу практической дoстоверности, надежности.

Доверительный коэффициент накопится по специальной таблице, представляющей собой интегральную математическую функции нормального распределения (приложение I).

Величина средней ошибки выборки зависит от вариации изучаемого признака в генеральной совокупности, объема (доли) выборки и способа отбора спинки тля наблюдения. В связи с этим существует несколько приемов расчета средней ошибки выборки.

Средняя ошибка случайной и механической выборки, доля которой в генеральной совокупности относительно невелика, рассчитывается следующим обратом:

(7.3)

гдe М_X — средняя ошибка выборки; - среднее квадратическое отклонение признака в выборочной совокупности; n - число вариант выборочной совокупности (численность выборки).

Допустим, необходимо рассчитать среднюю ошибку по массе меда, полученного от одной пчелосемьи, если известно, что выборочным обследованием охвачено 25 пчелосемей, а среднее квадратическое отклонение составило 10 кг. меда на одну пчелосемью.

Для расчета средней ошибки выборки воспользуемся формулой 7.3; получим:

Таким образом, для заданных условий средняя ошибка составит 2 кг меда на одну пчелосемью.

В тех случаях, где доля выборки в генеральной совокупности довольно значительна, при использовании случайного и механического отбора средняя ошибка выборки может быть найдена по следующей формуле

(7.4)

где - дисперсии признака в выборочной совокупности; N - число едениц в генеральной совокупности (численность генеральной совокупности).

Если сравнить среднюю ошибку выборки, рассчитанную по формулам 7.3 и 7.4, то можно заметить, что с повышением численности выборки и ее приближения к генеральной численности величина средней ошибки неизбежно сокращается. Например, если дополнить условие предыдущей задачи показателем общей (генеральной) численности, которая составила допустим, 100 пчелосемей, то средняя ошибка выборки, рассчитанная по формуле 7.4, составит:

Таким образом, при случайном отборе, охватившем каждую четвертую пчелосемью, средняя ошибка составит 1,73 кг меда на одну пчелосемью.

В некоторых случаях варианты признака могут быть представлены в форме удельного веса (доли) например, доля сортовых посевов в общей посевной площади культур, доля чистопородного поголовья в общей посевной площади культур, доля чистопородного поголовья в общей численности голов и дp. В связи с этим при расчете средней ошибки выборки необходимо учитывать некоторые особенности Но пpeжде всего целесообразно отметить, что не следует смешивать выборочную долю с полей выборки, так как выборочная доля - это варианта, выражающая удельный вес значения признака, а доля выборки представляет собой удельный вес численности выборки в составе генеральной совокупности.

Среднюю ошибку выборочной доли при случайном и механическом отборе, где удельный вес выборки относительно невелик, можно рассчитать следующим образом:

, (7.5)

гдe dх - выборочная доля признака; n - численность выборки.

Если же удельный вес выборки в генеральной совокупности сравнительно высок, то при случайном и механическом отборе среднюю ошибку выборочной доле можно найти по формуле

(7.6)

где N - численность генеральной совокупности.

Например, необходимо рассчитать среднюю ошибку выборки по доле чистопородных коров в стаде, насчитывающем 1000 голов, если по данным выборки (100 голов) доля чистопородных коров составляет 0,4 (40 %), а среднеквадратическое отклонение поли коров — 0,2 (20 %).

Воспользовавшись формулой 7.6, находим:

Следовательно средняя ошибка выборки по поле чистопородных коров во всем стаде составляет 0,046 (4,6 %}.

Целесообразно обратить внимание на то, что при использовании механического отбора обычно применяется те же приемы расчета средней ошибки выборки, что и при случайном отборе.

Расчет средней ошибки пропорциональной типической выборки имеет свои особенности. Дело в том, что разбивка генеральной совокупности на типические группы позволяет избегать влияния межгруповой вариации на точность выборки, так как в типической выборке должны быть обязательно представлены статистические единицы всех типических групп, что может не иметь места при случайном отборе. Поэтому средняя ошибка типической выборки зависит только от средней из внутригрупповых :дисперсии, а не от общей дисперсии, как это имеет место в случайной выборке.

Средняя ошибка пропорциональной типической выборки при случайном отборе рассчитывается следующим образом:

(7.7)

где - средняя внутригрупповая дисперсия признака; n — численность выборки.

Если необходимо найти среднюю ошибку пропорциональной типической выборки при случайном отборе, где выборка из генеральной совокупности довольно значительна, то расчет этой ошибки проводится по формуле:

(7.8)

где N - численность едениц в генеральной совокупности.

Пример. Проведение типической пропорциональной случайной выборки для определения средней урожайности картофеля в частных хозяйствах характеризуется следующими данными (табл.7.1). По этим данным необходимо рассчитать среднюю ошибку выборки.

Т а б л и ц а 7. 1. Порядок расчета дисперсии при типическом отборе

Категория хозяйств	Число хозяйств	Урожайность ц/га	Линейные отклонения урожайности, ц/га	Квадраты линейных отклонений	Взвешенные квадраты линейных отклонений
Всего	В т.ч. обследовано
	N	n	Х₀
Фермерские				-85
Крестьянские				-35
Личные подсобные
ИТОГО			-	-	-

По данным, приведенным в табл.7.1, целесообразно рассчитать, прежде всего, среднюю выборочную урожайность картофеля во всех категориях частных хозяйств (по формуле средней арифметической взвешенной величины):

В свою очередь выборочная дисперсия урожайности картофеля по всем категориям частных хозяйств составит:

Теперь можно рассчитать среднюю ошибку выборки для условий, приведенных в табл. 7.1 (по формуле 7.8):

Следовательно, проведение типического отбора в частных хозяйствах области показало, что средняя ошибка выборки по урожайности картофеля составит не менее 1,2 ц/га.

В условиях применения серийного отбора для расчета средней ошибки выборки обычно используют следующую формулу:

где дисперсия признака по выборочным сериям; n_c- численность отобранных серий; Nс - общее число серий в генеральной совокупности.

Известно, что при серийном способе отбора каждая серия выступает в качестве самостоятельной статистической единицы. Поэтому при таком способе средняя ошибка выборки зависит только от дисперсии, сформированной за счет колеблемости признака от серии к серии. Совершенно очевидно, что доля расчета дисперсии необходимо взять средние значения признака по каждой отобранной серии и среднюю величину признака по выборочной совокупности в мелом.

Пример. Выборочное наблюдение урожайности пастбищ в области проводилось при помощи отбора районов. По каждому отобранному району рассчитана средняя урожайность пастбищ. Необходимо определить среднюю ошибку выборки по урожайности пастбищ в области (табл. 7.2).

Данные табл. 7.2 позволяют рассчитать, прежде всего, среднюю урожайность пастбищ по отобранным сериям:

Дисперсия урожайности пастбищ в отобранных сериях составит:

Т а б л и ц а 7.2 Порядок расчёта дисперсии при серийном отборе

№ серии	Число районов в каждой серии	В т.ч. обследовано	Урожайность по сериям, ц/га	Линейные отклонения урожайности	Квадраты линейных отклонений
	N_c	n_c
				-40
				-20



Σ

Теперь можно найти среднюю ошибку выборки по урожайности пастбищ в области, применив формулу 7.9:

Следовательно, средняя ошибка серийного бесповторного отбора по урожайности пастбищ в области составляет 11,3 ц/га.