Выборочное наблюдение, оценка генеральных параметров

Статистическая методология исследования массовых явлений различает два способа наблюдения: методом сплошного и несплошного наблюдения. Для исследования части единиц совокупности (проведения несплошного наблюдения) используются три метода: метод основного массива, выборочный и монографический.

Каждый из методов формирует выборочную совокупность или выборку, являющуюся частью всей совокупности. Вся совокупность единиц называется генеральной. Обязательное назначение каждого из методов – распространение результатов исследования части единиц совокупности на совокупность в целом.

Метод основного массива состоит в отборе наиболее крупных единиц совокупности в выборочную совокупность, обладающих изучаемым свойством.

Монографический метод представляет собой отбор одной или нескольких единиц совокупности, подвергающихся более тщательному изучению их свойств.

Выборочный метод представляет собой метод несплошного наблюдения, при котором отбор из основной совокупности выполняется в случайном порядке, в соответствии с научными принципами теории выборочного метода. Основные принципы выборочного метода – случайность отбора (равной возможности попадания в выборку) и репрезентативность, представительство по всем признакам изучаемой совокупности.

Выборочное наблюдение – несплошное наблюдение, выполненное выборочным методом, при котором отобранная часть изучается, а результаты распространяются на всю совокупность.

Главным условием качества первичных данных статистического наблюдения является достоверность и полнота. В проведении ряда исследований наиболее предпочтительным представляется выборочный метод. В основу отбора выборочным методом лежит принцип равной возможности попадания в выборку каждой единицы генеральной совокупности, случайностью отбора.

При любом статистическом исследовании сплошном или несплошном возникают ошибки двух видов: регистрации и репрезентативности. Ошибки регистрации возникают в результате сбора, занесения информации об изучаемом явлении или процессе и могут быть случайными (непреднамеренными, неискажающими общей картины явления) и систематическими (тенденциозными или преднамеренными, умышленно искажающими картину явления). Ошибки репрезентативности присущи только несплошному статистическому наблюдению и возникают в связи с отличием выборочной и генеральной совокупностей.

Условие случайности отбора предупреждает появление систематических (тенденциозных) ошибок и делает возможной оценку ошибки представительства (репрезентативности). Очевидное отличие выборки от генеральной совокупности позволяет сделать вывод о различиях в оценке показателей, характеризующих генеральную совокупность (генеральных параметров) и выборку (выборочных параметров). Это отличие составляет ошибку выборки.

Ошибка выборки (репрезентативности)- разница между значением показателя, полученного по выборке и генеральным параметром. Ошибка выборки оценивается в зависимости от метода отбора повторного или бесповторного. Так повторный метод представляет собой выбор единицы совокупности и возврат ее в основную совокупность после регистрации ее свойств и признаков, при этом выбранная единица может снова служить объектом отбора. При бесповторном отборе единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается, при такой выборке численность единиц генеральной совокупности сокращается.

Основные генеральные параметры, служащие оценке ошибки выборки представлены в таблице:

Характеристики Генеральная совокупность Выборочная совокупность
1. Объем совокупности N n
2. Число единиц, обладающих изучаемым признаком M m
3. Доля единиц, обладающих изучаемым признаком
4. Средняя величина признака
5. Дисперсия количественного признака
6. Дисперсия доли

 

Основные генеральные параметры, для которых выполняется оценка с использованием ошибки – генеральная средняя (среднее значение признака в генеральной совокупности) и генеральная доля (доля единиц генеральной совокупности, обладающая изучаемым свойством). Для этого используются выборочная средняя (среднее значение признака в выборке) и выборочная доля (доля единиц выборки, обладающая изучаемым свойством ), предельная ошибка выборки () и предельная ошибка выборочной доли ().

Очевидно, что генеральный и выборочный параметры отличаются друг от друга. Так: предельная ошибка выборочной средней ,а предельная ошибка выборочной доли где - значения средней величины и доли для выборочной совокупности, - значения средней величины и доли генеральной совокупности, отсюда:. Причем, предельная ошибка выборочной средней является произведением параметра функции Лапласа и средней ошибки выборочной средней (Sx):

для повторного отбора  
для бесповторного отбора

Предельная ошибка выборочной доли является произведением параметра функции Лапласа и средней ошибки выборочной доли (Sw)

для бесповторного отбора
для повторного отбора  

где n –объем выборки, N – объем генеральной совокупности.

Значение параметра t разыскивается по таблице значений функции Лапласа (таблица 4), значение , где m-число единиц совокупности, обладающих изучаемым признаком. Некоторые значения функции Лапласа:

t
Ф(t) 0,683 0,954 0,997

 

Тогда доверительным интервалом

· для генеральной средней будет: ;

· для генеральной доли, соответственно: .

Рассмотрим пример:

С целью изучения занятости населения города на предприятиях проведена 5%-ная механическая выборка, в результате которой получено следующее распределение предприятий по численности работников:

Группы по численности работников, чел. Число предприятий
До
и выше

1. С вероятностью 0,997 определить ошибку выборочной средней и возможные границы, в которых ожидается средняя численность на предприятиях города.

2. С вероятностью 0,954 предельную ошибку выборочной доли и границы удельного веса предприятий с численностью работников от 25 до 100 человек.

Рассчитаем выборочную среднюю и дисперсию по способу моментов (ряд является интервальным рядом распределения с равными интервалами), для этого найдем условный ноль и шаг: A =62,5 (середина интервала с максимальной частотой); h=25.

Группы по численности работников, чел. Число предприятий
До -2 -30
-1 -20
и выше
Итого:   -15

Значения вероятности позволяет по таблице значения функции Лапласа найти значения параметра t, так для расчета предельной ошибки выборочной средней t=3, для расчета предельной ошибки выборочной доли t=2. Так как отбор был бесповторным, то расчет предельных ошибок производится по соответствующим формулам.

1. =58,75; 27,6982; 8,099 Þ 50,65166,849, средняя численность работников на предприятиях города от 50 до 67 человек;

2. 0,800; 0,077974 Þ 72,2%87,8%, доля предприятий с численностью от 25 до 100 человек на всех предприятиях города составляет от 72,2% до 87,8%.

Существует определенная зависимость между функцией Лапласа, дисперсией и значениями осредняемого признака статистической совокупности (правило 3s), так:

- если доверительный интервал , то у 68,3% единиц совокупности значение признака попадает в указанный интервал;

- если доверительный интервал , то у 95,4% единиц совокупности значение признака попадает в указанный интервал;

- если доверительный интервал , то у 99,7% единиц совокупности значение признака попадает в указанный интервал.

Основные причины использования несплошного наблюдения: экономия средств и времени, возможность быстрого получения необходимых данных.