Реферат Курсовая Конспект
П. СПОСОБЫ ОТБОРА ЕДИНИЦ В ВЫБОРОЧНУЮ СОВОКУПНОСТЬ - раздел Философия, РАЗДЕЛ 1. ОБЩАЯ ТЕОРИЯ СТАТИСТИКИ Отбор Единиц Из Генеральной Совокупности Можно Производить По-Разному В Завис...
|
Отбор единиц из генеральной совокупности можно производить по-разному в зависимости от целого ряда условий. Принимая решение о выборе способа отбора единиц или групп генеральной совокупности следует учитывать не только точность, но и стоимость его проведения. Обычно объем затрат рассчитывают или на единицу совокупности, или на группу единиц. По способу отбора единиц из генеральной совокупности различают несколько видов выборки:
- собственно-случайную;
- типическую;
- механическую;
- серийную;
- комбинированную;
- ступенчатую;
- многофазную;
-одно и многоцелевую;
- квантильную;
- малую выборку.
Собственно-случайный отбор. При этом виде отбора единицы из генеральной совокупности отбираются случайно. Никакой предварительной систематизации единиц генеральной совокупности не производится. Каждая единица имеет одинаковую вероятность попасть в выборку. Случайная выборка позволяет дать объективную оценку генеральной совокупности.
Случайная выборка м.б. осуществлена при помощи жеребьевки, когда все единицы совокупности нумеруются и на каждую единицу заводится жребий. Жребии тщательно перемешиваются и наудачу отбираются. Применяемый в этом случае отбор является индивидуальным, так как отбираются отдельные единицы совокупности.
Случайный отбор может быть повторным, когда отобранная единица после регистрации возвращается в совокупность и вновь участвует в выборке, и бесповторном, когда отобранная единица после регистрации обратно не возвращается.
Примером собственно-случайного бесповторного отбора является денежно-вещевая лотерея. Случайная повторная выборка является наиболее простой, но она редко применяется в социально-экономических исследованиях.
Для проведения случайной выборки пользуются иногда таблицей случайных чисел.
Таблица случайных чисел используется следующим образом: все единицы генеральной совокупности нумеруются, а затем из таблиц выписывается столько чисел, сколько требуется для выборки. Из генеральной совокупности отбираются те единицы, порядковый номер которых соответствует выписанным из таблицы случайным числам. Если число единиц в генеральной совокупности не более 999, то при четырехзначных случайных числах последнюю или первую цифру четырехзначного числа отбрасывают. Выборка с помощью таблицы случайных чисел м.б. произведена на схеме повторного отбора и по схеме бесповторного отбора. В последнем случае одинаковые числа опускаются.
Для расчета средней ошибки выборки при собственно-случайном отборе используются следующие формулы:
При повторном | При бесповторном | |
Для средней | ||
Для доли |
Например: I) Из совокупности 10000 деталей отобрано собственно-случайным бесповторным методом 1000 деталей, для которых средний, все детали оказался равным 50гр., . Вычислим среднюю ошибку выборки для средней и пределы^в которых с вероятностью 0,954 находится генеральная средняя.
Дано: N = 10000; n = 1000; ; . Тогда средняя ошибка выборки равна: . Отсюда . Значит .
2) Случайной бесповторной выборкой 400 деталей установлено, что среди отобранных деталей 8 оказалось бракованных с вероятностью 0,954 найти долю брака для всей совокупности, состоящей из 40000 деталей.
или 2%.
t=2
N=40000 n=400
Найдем среднюю ошибку выборки
Отсюда предельная ошибка выборки или 1,38%.
Следовательно, с вероятностью 0,954 можно утверждать, что во всей совокупности деталей доля бракованных изделий заключается в пределах
Если ошибка такого размера (1,38%) считается большой, то для изучения доли брака следует произвести новую выборку, увеличив ее объем.
Механический отбор. Однако на практике собственно-случайный отбор применить бывает сложно, поэтому его используют очень редко. Обычно применяют механический отбор единиц выборочной совокупности, который организовать значительно легче.
Механический отбор - это разновидность собственно-случайного отбора, но он имеет ряд организационных преимуществ. В частности, при нем легче и проще организовать проверку правильности отбора единиц совокупности.
При механическом отборе подлежащие выборочному обследованию единицы совокупности отбираются в определенной последовательности. Для его проведения все единицы совокупности располагают в каком-то определенном порядке, например, в алфавитном, географическом, по местоположению, по возрастанию или убыванию признака и т.д., а потом в зависимости от объема выборки механически, через определенный интервал отбирается необходимое количество единиц (например, каждая вторая, пятая, десятая и т.д.).
Механический отбор можно применить и, не прибегая к составлению списков и размещению единиц совокупности в определенном порядке, а используя тот естественный порядок, в котором фактически расположены единицы генеральной совокупности, если этот порядок не приводит к тенденциозным ошибкам. Так, например, при выборочном обследовании качества продукции берут через определенный интервал изготовленные изделия ( допустим изделие, изготовленное через каждый час).
При механическом отборе возникает необходимость, во-первых, определить интервал, с которым отбираются единицы в выборочную совокупность, а, во-вторых, решить с какой единицы начать отбор.
Интервал определяют как частное от деления численности генеральной совокупности на численность выборки. Так, при механическом отборе 100 студентов из 1000 поступают следующим образом: составляют алфавитный список, в который включают всех студентов и определяют интервал, равный частному от деления численности генеральной совокупности на численность выборочной совокупности = 10 (1000 : 100), следовательно, по составленному в алфавитном порядке списку будет механически выбирать каждого 10 студента.
Отсчет можно начать с любого числа из первых десяти. Если отбор начинать со 2 номера, то в выборку попадут 2, 12, 22, 32 и т.д. если с 5 номера, то - 5, 15, 25, 35 и т.д.
Таким образом, при механическом отборе генеральную совокупность предварительно как бы разбивают на равные по объему группы по случайному, а не типическому признаку. (Количество групп определяется численностью выборочной совокупности). Затем из каждой группы берется, как правило, одна единица. При этом механический отбор всегда бывает бесповторным.
Чаще всего механический отбор применяют при проверке качества продукции. В промышленности, например, для проверки качества продукции обследуют детали, выпущенные через равные промежутки времени. В торговле механический отбор находит широкое применение в товароведной практике при проверке качества товаров. При проверке качества поступивших товаров механически из партии отбирается в соответствии с требованиями ГОСТа определенное количество единиц (каждая 5, 10 и т.д.), а затем отобранные единицы подвергаются обследованию.
Средняя ошибка выборки определяется по формуле случайного бесповторного отбора.
Правильнее было бы в формуле средней ошибки выборки вместо общей дисперсии брать среднюю из частных дисперсий по группам (). Такая дисперсия меньше общей дисперсии. Поскольку для расчета дисперсий по группам нужно знать размеры всех единиц совокупности, а они неизвестны, приходится брать общую дисперсию, полученную из выборочных данных.
Типическая выборка. Типический отбор применяют с тех случаях, когда имеют дело с неоднородными по изучаемым показателям совокупностями. При типической выборке прежде всего устанавливают типические признаки, по которым генеральная совокупность разбивается на качественно однородные, однотипные группы. Затем из каждой группы собственно-случайным или механическим способом производится отбор единиц выборочной совокупности.
Число отбираемых единиц из каждой типической группы зависит от ряда факторов, в том числе от способа отбора. Различают следующие виды выборки единиц из типических групп: непропорциональной их объему, пропорциональной их объему, пропорциональной колеблемости групп»,пропорциональной объему типических групп и колеблемости.
1. При выборке непропорциональной объему типических групп отбор из всех групп производят поровну, а число единиц, отбираемых из каждой группы, определяют отношением численности выборочной совокупности к числу групп.
2. На практике чаще всего используют выборку пропорциональную объему типических групп. Число наблюдений по каждой группе определяется в этом случае по формуле: , где
ni - объем выборки из (i -ой группы;
n - общий объем выборки;
Ni - объем i-ой типической группы;
N - объем генеральной совокупности.
Пример I. Допустим, необходимо провести типический отбор 1500 студентов из 10000, обучающихся на 4-х ф-тах института. Сгруппируем их в однородные группы по факультетам, а затем по каждому из них отберем число студентов, пропорционально уд. веса студенческого контингента института по факультетам.
Распределение студентов по факультетам
Факультет | Число студентов | Уд.вес студентов в общей численности (%) | Отобрано студентов для выборочных наблюдений |
I | |||
II | |||
III | |||
IV | |||
3. Если вариация признака в группах неодинакова, а так чаще всего и бывает, то прибегают к переменной доле, т.е. отбираемая доля ставится в прямую зависимость от величины колеблемости, чем больше колеблемость, тем больше доля отбора.
4. Возможен также типический отбор пропорциональный обоим показателям - численности единиц в группах и степени колеблемости признака. Такой отбор называют оптимальным.
Типический отбор выгодно применить при большой межгрупповой вариации. Поэтому при изучении сложных совокупностей одним из важнейших принципов выборочного наблюдения является предварительное районирование, выделение типических групп.
Разбивка на типические группы дает возможность избежать влияния межгрупповой вариации на точность выборки, так как в типическую выборку должны обязательно попасть представители всех групп, что может не иметь места при случайном отборе. Поэтому средняя ошибка типической выборки будет зависеть только от средней из дисперсий групп , а не от общей дисперсии, как это имеет место в случайной выборке. Из правил сложения дисперсий известно, что , следовательно, ошибка типической меньше ошибки случайной выборки, а типическая выборка точнее.
Типический отбор дает более точные результаты, чем собственно-случайной или механический, т.к. при нем в выборку в такой же пропорции, как и в генеральной совокупности, попадают единицы из всех типических групп. Поэтому выборка становится более репрезентативной, представительной и, следовательно, более точной. В результате при одной и той же численности выборки в типическом отборе по сравнению с механическим уменьшается ошибка выборки. Или иначе при одной и той же допустимой ошибке выборки численность выборки при типическом отборе д.б. ниже.
Типическая выборка может быть повторной и бесповторной.
Средняя ошибка при пропорциональной типической выборке определяется по формулам:
В случае повторного отбора:
При бесповторном отборе:
При отборе непропорциональном объему групп для определения средней ошибки выборки применяют следующие формулы:
При повторной выборке:
При бесповторной выборке:
, где:
- выборочная дисперсия i -и типической группы;
- средняя из выборочных дисперсий типических групп;
- среднее квадратическое отклонение в выборке из i- ойтипической группы;
- средняя из произведения частностей на дополнение их до единицы.
Расчет средней и предельной ошибки выборки при проведении типической пропорциональной бесповторной выборки можно рассмотреть на примере П и Ш.
Пример П. Типическая пропорциональная бесповторная выборка при определении размера пенсии показала следующие результаты:
Отрасли, где работали пенсионеры до выхода на пенсию | Обследовано пенсионеров данной отрасли, () | Средний размер пенсий данной отрасли, (х) | Дисперсия средней, () |
I | |||
II | |||
III |
Найти пределы, в которых расположен средний размер пенсии во всей совокупности пенсионеров, если результат гарантируется с вероятностью 0,997 ( t= 3), а обследованию подвергалось 2% пенсионеров ().
Найдем средний размер пенсии для всех групп:
Средняя из частных дисперсий составит:
Отсюда средняя ошибка выборки определяется:
Предельная ошибка выборки =
Следовательно, в генеральной совокупности средний размер пенсии заключен в пределах: руб.
Ш. При изучении производительности труда работников машиностроительного предприятия произведено 10%-ное выборочное обследование выполнения норм выработки. В результате пропорционального типического отбора из групп слесарей прошедших и не прошедших производственное обучение получены следующие данные о распределении выборочной совокупности по уровню выполнения норм выработки за смену.
Группы слесарей | Выполнение норм выработки (%) | |||||||
До 90 | 90-100 | 100-110 | 110-120 | 120-130 | 130-140 | 140 и выше | ||
1. Прошедших пр. обучение | - | |||||||
2. Не прошедших пр. обучение | - | |||||||
При условии, что в каждой группе производилось собственно-случайная бесповторная выборка, определите для генеральной совокупности (с вероятностью 0,954) пределы значений уд. веса слесарей не выполняющих нормы выработки.
Для установления предела, в котором находится доля слесарей, не выполняющих нормы выработки, воспользуемся формулой:
Доля в выборочной совокупности
а) по выборке в целом
б) для I группы
в) для П группы
Средняя дисперсия альтернативного признака
Средняя ошибка выборочной доли:
Предельная ошибка составит
Определим предел значения доли изучаемого признака в генеральной совокупности:
Следовательно, для всей изучаемой совкупности уд. вес слесарей не выполнивших норм выработки составляет от 0,05 до 0,15, или .
Серийная выборка. При случайной, механической и типической выборке из генеральной совокупности отбирают отдельные единицы, которые подвергают обследованию. Совершенно иначе организуется выборка, если в основу ее положен серийный отбор. При серийной выборке из генеральной совокупности отбираются не отдельные единицы, а целые их серии (гнезда), а внутри каждой из попавших в выборку серий обследуются все без исключения единицы, т.е. применяется сплошное наблюдение. На практике для отбора серий применяют или случайную выборку или механический отбор.
Серийный отбор часто применяют при выборочном контроле качества продукции. Например, при 10/5 выборочном обследовании качества продукции можно брать каждую 10 изготовленную деталь, а можно подвергнуть обследованию все детали, изготовленные за определенный час работы, например, за 7, 8 или 2 часа.
В первом случае будет механический отбор единиц совокупности, во втором - серийный.
Серийный отбор имеет большое практическое значение, так как он проще, его легче организовать и можно провести быстрее. Так, при контрольной проверке качества продукции или сырья, поступивших партиями (ящиками, мешками, пачками), легче и быстрее проверить несколько отобранных партий, товара целиком, чем из каждой партии отбирать и проверять отдельные единицы. Но так как при серийном отборе нарушается равномерность распределения отобранных единиц в генеральной совокупности, то, как правило, серийная выборка менее точна, чем выборка основанная на индивидуальном отборе. Поэтому для обеспечения той же точности, что и при механическом и случайном отборе единиц совокупности требуется большая численность выборки.
Серийная выборка м.б. организована повторным и бесповторным мето-дом. Кроме того, серии м.б. равновеликими и неравновеликими.
Практически серийная выборка производится по схеме бесповторного отбора.
Точность серийной выборки зависит не от величины общей дисперсии, а от межсерийной дисперсии, или, иначе, дисперсии групповых средних.
Как известно, межгрупповая (межсерийная) дисперсия исчисляется по ф-ле:
, где r - число отобранных серий;
- средняя в отдельных сериях;
- общая средняя для всей совокупности.
Для определения средней ошибки выборки применяются формулы: (при отборе равновеликими партиями):
I) Для средней величины количественного признака:
при повторном отборе:
при бесповторном отборе:
Например: Выборочное наблюдение урожайности зерновых культур по области проводилось при помощи отбора районов. По каждому отобранному району определялась средняя урожайность, которая оказалась следующей: I - 14ц.; 2 - 15ц.; 3 - 14,5ц.; 4 - 15,5ц.; 5 - 16ц. с га. С вероятностью 0,997 оценить урожайность зерновых по всей области. В области 25 районов.
Прежде всего необходимо найти среднюю:
ц/га
Затем рассчитаем межгрупповую дисперсию:
ц/га
Средняя ошибка серийного бесповторного отбора:
ц/га
Предельная ошибка выборки:
Следовательно, с вероятностью 0,997 можно ожидать, что средняя урожайность зерновых в этой области заключается в пределах:
2) Для доли альтернативного признака: , где
- межсерийная дисперсия выборочной доли.
Расчет средней и предельной ошибки выборки можно рассмотреть на примере:
При контрольной проверке качества выпускаемых изделий проведено 10% выборочное обследование. Из партии, содержащей 100 коробок методом механического отбора в выборку взято 10. В результате сплошного обследования находящихся в каждой коробке деталей получили следующие данные о распределении выборочной совокупности:
Коробки | Количество упаковок (деталей) | ||
Всего | В т.ч. с весом 400г | ||
I. | 6-ая | ||
2. | 16-ая | 36 | |
3. | 26-ая | ||
4. | 36-ая | ||
5. | 46-ая | ||
6. | 56-ая | ||
7. | 66-ая | ||
8. | 76-ая | ||
9. | 86-ая | ||
10. | 96-ая | ||
По данным выборочного обследования установить с вероятностью 0,95 предел удельного веса стандартной продукции во всей партии.
По условию к стандартной продукции относят изделия весом не более 400г.
Для установления предела, в котором во всей партии находится доля стандартной продукции, используем ф-лу:
Для определения составим таблицу:
№№ п/п | 'Количество деталей | Расчетные графы | ||||
Всего (ni) | В т.ч. с весом 400 г. (mi) | |||||
I. | 1.0000 | 0.042 | 0,001764 | |||
2. | 0,972 | 0,014 | 0,000196 | |||
3. | 0,917 | -0,041 | 0,001681 | |||
4. | 0,944 | -0,014 | 0,000196 | |||
5. | 0,944 | -0,014 | 0,000196 | |||
6. | 1,000 | 0,042 | 0,001764 | |||
7. | 0,944 | -0,014 | 0,000196 | |||
8. | 0,917 | -0,041 | 0,001681 | |||
9. | 0,944 | -0,014 | 0,000196 | |||
10. | 1,000 | 0,042 | 0,001764 | |||
0,958 | - | 0,009634 | ||||
Тогда ,
Следовательно, во всей партии изделий доля стандартной продукции (с вероятностью 0,95) находится в пределе:
Серийная выборка будет тем точнее, чем равномернее изучаемый признак распределен по сериям.
Комбинированная выборка. Рассмотренные способы образования выборки на практике обычно применяются не в "чистом" виде, а комбинируются в различных сочетаниях и с различной последовательностью. Это вызвано тем» что отбор единиц для обследования представляет сложный процесс, который в каждом конкретном случае может осуществляться по-разному.
Комбинированная выборка предполагает использование нескольких способов отбора. Примером комбинированной выборки может быть сочетание серийной (групповой) выборки и случайной (с индивидуальным отбором единиц совокупности). В этом случае генеральная совокупность прежде всего разбивается на одинаковые по объему серии (группы). В начале отбираются серии, затем из отобранных серий производят индивидуальную выборку единиц.
Такая комбинированная выборка может быть повторной (для групп и единиц) и бесповторной.
Комбинированную выборку можно получить и при других комбинациях видов отбора.
Применение комбинированной выборки зависит от того, насколько та или иная комбинация обеспечивает сбор необходимой статистической информации. Опыт выборочных наблюдений свидетельствует, что комбинация различных методов отбора позволяет уменьшить ошибки репрезентативности.
Нужно отметить, что средняя ошибка выборки при разных комбинациях ее способов исчисляется по-разному в зависимости от ступенчатости выборки.
Многоступенчатый отбор. В статистике различают одноступенчатый и многоступенчатый способы отбора единиц в выборочную совокупность.
Одноступенчатым называется отбор, при котором единицы или серии для выборочного наблюдения отбираются непосредственно из генеральной совокупности.
При многоступенчатой выборке из генеральной совокупности вначале отбирают крупные серии (группы единиц), затем группы по объему, а затем отдельные единицы, которые подвергают наблюдению. Так производится типическая выборка с механическим способом отбора единиц в выборочную совокупность.
Примером многоступенчатой выборки может быть отбор семей для бюджетного обследования. На первой ступени отбираются районы, второй ступенью является отбор населенных пунктов и третьей - отбор отдельных семей. Причем способы отбора на отдельных ступенях выборки могут меняться. Так, при отборе районов обычно используют собственно-случайный отбор, отбор населенных пунктов - механическая выборка, а при отборе семей вновь применяют собственно-случайный отбор.
В отличие от типической выборки, где отбор производится из всех без исключения групп, при многоступенчатом отборе производится отбор самих групп, и, следовательно, не все они попадают в выборку.
Число ступеней отбора определяется числом типов единиц отбора, при этом на каждой последующей ступени единицы отбора по своим масштабам уменьшаются и на конечной ступени единица отбора совпадает с единицей выборочной совокупности.
Ошибки многоступенчатой выборки складываются из ошибок на отдельных ступенях отбора. Если число ступеней отбора больше двух, то средняя ошибка выборки определяется по формуле:
, где,
- средние ошибки выборки на отдельных ступенях;
- численность выборок на соответствующих его тупенях.
Приведенная формула средней ошибки выборки пригодна для групп равных объемов, чего практически никогда не бывает. Формула средней ошибки выборки для неравновеликих групп на равных ступенях отбора слишком громоздка, а дает практически те же результаты, что и приведенная выше. Поэтому необходимо добиваться, чтобы сохранялась общая доля отбора на всех ступенях, тогда упростится расчет ошибки выборочного наблюдения.
Многоступенчатый отбор, как правило, дает менее точные результаты по сравнению с одноступенчатым. Объясняется это тем, что ошибки многоступенчатой выборки складываются из ошибок на отдельных ступенях отбора. Но, тем не менее, на практике используют многоступенчатый отбор в тех случаях, когда одноступенчатую выборку организовать невозможно или очень сложно.
Многофазная выборка. Многофазная выборка характеризуется тем, что на всех ступенях выборки сохраняется одна и та же единица отбора, но проводится несколько стадий, фаз выборочных обследований, которые различаются между собой широтой программы обследования и объемом выборки, когда выборочные совокупности образуются так, что одни сведения собираются от всех единиц, а затем отбираются еще некоторые единицы и обследуются по более широкой программе.
Выборка может быть двухфазная, трехфазная, четырехфазная и т.д.
Примером многофазной выборки может служить обследование крестьянских хозяйств земскими пензенскими статистиками в дореволюционной России. В начале была произведена сплошная подворная перепись всех крестьянских хозяйств по сокращенной похозяйственней карточке. Затем каждое третье хозяйство описывалось по более полной, но все же краткой программе, каждое девятое - по еще более полной, подробной программе, а каждое 27 хозяйство - по специальной программе и, наконец, 25 хозяйств на уезд подвергались детальному бюджетному обследованию (5 фазная выборка). Итак, пять ступеней выборки, на всех одна единица отбора - крестьянское хозяйство, 5 программ и каждая более полная включает в себя вопросы краткой программы, что дает возможность проверить репрезентативность выборки.
В переписи 1979г. сведения по короткой программе ( 11 - вопросов) были получены, а от всего населения по расширенной программе (16> - вопросов), которая включала в себя и вопросы короткой программы поступали от каждого четвертого (25% выборка).
Важной особенностью многофазной выборки является возможность использовать сведения, полученные на первой фазе, для уточнения расчетов на последующих фазах исследования.
Так, например, сведения, полученные при сплошной переписи населения 1979г. (вопросы I-П программы переписи) используются для уточнения оценок, полученных при выборочном 25% обследовании (вопросы 12-18 программы).
Многофазная выборка отличается от многоступенчатого отбора. При многофазной выборке на каждой фазе сохраняется одна и та же единица отбора. (В переписи 1979г. сведения по краткой и расширенной программе поступали от одного и того же лица). При многоступенчатых выборках единица отбора на каждой ступени выборки различная, а обследованию подлежат только единицы, отобранные на последней ступени. (При обследовании бюджетов семей - I стадия - районы, П - населенных пунктов - Ш ступень - отдельные семьи. Обследованию подлежат только бюджеты отдельных семей).
Расчет ошибки многофазной выборки производится для каждой фазы в отдельности.
Моментное наблюдение. Особым видом выборочного наблюдения является моментное наблюдение. Этот метод получил широкое распространение в последние годы. В промышленности, строительстве и других отраслях народного хозяйства его чаще всего используют для изучения использования рабочего времени и времени использования оборудования, В торговле моментное наблюдение применяется для изучения покупательского спроса, ассортимента товаров, структуры рабочего времени и т.д.
Сущность его состоит в том, что отдельные элементы изучаемого процесса фиксируются на определенные моменты времени. Моментное наблюдение является выборочным во времени и сплошным по охвату единиц совокупности. Если моментное наблюдение применяется для изучения времени работы оборудования или использования рабочего времени, то при наблюдении фиксируется находился ли рабочий или станок в процессе работы или в простое. Моментное наблюдение охватывает всех рабочих цеха или все станки и в этом смысле является сплошным. Выборочное же оно потому, что охватывает не все время работы цеха (смены), а лишь определенные моменты, в которые осуществляется контроль использования рабочего времени или времени работы оборудования.
Понятия генеральной и выборочной совокупности относятся здесь ко времени наблюдения. В качестве генеральной совокупности обычно выступает фонд рабочего времени или времени использования оборудования. Под выборочной совокупностью понимается сумма тех отрезков времени, в которые ведется регистрация состояния исследуемого объекта. При этом принимается во внимание длительность регистрации и интервалы времени.
Как и всякое выборочное наблюдение, моментное наблюдение имеет целью на основе характеристики выборочной совокупности дать репрезентативную оценку всей генеральной совокупности. Поскольку при моментном наблюдении обычно характеризуется альтернативный признак (работа - простой, наличие - отсутствие), то оценка репрезентативности производится по формулам средней и предельной ошибки выборочной доли. При этом в качестве выборочной совокупности принимается число записей моментного обследования.
Например: I) В цехе работает 20 станков и за 8-часовую смену каждые 30 минут проводились моментные регистрации. Всего было сделано 320 записей (16*20). В 288 записях было отмечено, что станок работал, а в 32 - что он был в простое. Тогда доля работающих станков = 0,9, а ошибка выборки при t=2 составит:
Следовательно, с вероятностью 0,954 можно утвервдать, что доля работающих станков за все время смены составила 0,9 0,033, т.е. от 86,7 до 93,3%.
2) В цехе проводилось моментное наблюдение использования рабочего времени, для чего в течение 15 мин. производилось регистрация состояния занятости всех рабочих, которая показала, что за все время наблюдения, составившее 5120 мин. 430 мин. приходилось на неосновное время (рабочий был занят другими делами); было сделано 256 записей (П = 256).
Следовательно в выборочной совокупности неосновное время заняло 430/5120 = 0,084 или 8,4%. Эту величину обозначим через .
Ошибка выборочного наблюдения с вероятностью 0,954, т.е. при = 2, составит:
Следовательно, с вероятностью 0,954 можно утверждать, что в генеральной совокупности рабочего времени обследованного цеха неосновное время составит 8,4% 3,4% , т.е. будет не менее 5% и не более 11,8%, а рабочее время в пределах 88,2 – 95% фонда времени.
При использовании моментного наблюдения для характеристики неосновного времени, когда регистрация ведется с отметкой о видах затрат на неосновное время, а удельный вес различных видов затрат в общих затратах неосновного времени неодинаков, расчет дисперсии доли этого времени производится как средний величины из произведений , где -доля затрат неосновного времени по отдельным элементам, взвешенных по числу повторяющихся элементов.
3) В секции магазина работает 10 продавцов, за 7 часовую смену каждые 30 мин. проводились моментные регистрации. Следовательно, всего за 7 часов было сделано 140 записей. Причем в 100 случаях было отмечено, что продавцы обслуживали покупателей. Тогда доля работающих продавцов и ошибка выборки при t = I
Следовательно, с вероятностью 0,683 можно утверждать, что доля работающих продавцов за все время смены составила 0,710,0016, т.е. находилась в пределах 70,84 - 71,16%.
Использование моментного наблюдения имеет преимущества. С помощью этого метода возможно быстро получить обширную информацию с затратами значительно меньшими, чем при сплошном наблюдении, а правильная их организация обеспечивает вполне точные результаты.
Малая выборка. С увеличением численности выборочной совокупности повышается точность выборочных данных. И наоборот, уменьшение объема выборки ухудшает репрезентативность, приводит к значительным ошибкам при определении характеристик совокупности. И, тем не менее, иногда приходится ограничиваться малым числом наблюдений. Чаще всего эта необходимость возникает при проверке качества продукции, на производстве, товаров в товароведной практике, связанной с уничтожением образцов. В подобных случаях большой объем выборки может привести к значительным материальным затратам, поэтому на практике ограничиваются так называемой малой выборкой. Под малой выборкой в статистике понимают выборочное наблюдение, численность единиц которого не превышает 20 (Н.Н.Ряузов) - 30 (Овененко, Кильдишев) ед., а иногда бывает и меньше 4-5 единиц.
В математической статистике доказывается, что при малых выборках характеристики выборочной совокупности можно распространить на генеральную. Но расчет средней и предельной ошибки выборки будет иметь свои особенности.
I) В математической статистике доказано, что соотношение между генеральной дисперсией и выборочной дисперсией такое
Следовательно, выборочная дисперсия меньше генеральной на величину . В тех случаях, когда "n " достаточно велико, коэффициент становится близким к I. Так, при n =100, коэффициент равен 1,01 , при n = 500, коэффициент равен 1,002
Следовательно, при большой численности выборки, выборочные дисперcии совпадают с генеральными, а среднее квадратическое отклонение признака в выборочной совокупности рассчитывают по той же формуле, что и среднее квадратическое отклонение в генеральной совокупности, т.е.
для негруппированных данных.
Но если при большом числе единиц выборочной совокупности, полировочным коэффициентам , на которой необходимо умножить
выборочную дисперсию, чтобы получить генеральную, можно пренебречь,
то при небольшом объеме выборки его необходимо учитывать. Поэтому
дисперсия малой выборки м.в. определяется по формуле:
а среднее квадратическое отклонение:
Это 1-ая особенность в расчете средней и предельной ошибок малой выборки.
Иными словами, дисперсия малой выборки и среднее квадратическое отклонение определяются с учетом так называемого числа степени свободы. Под числом степеней свободы понимается количество вариантов, которые могут принимать произвольные значения, не меняя величины средней. При определении м.в. число степеней свободы равно (n-1)
Для расчета средней ошибки малой выборки используют формулу:
где, м.в. - дисперсия малой выборки;
n - число единиц малой выборки.
Предельная ошибка малой выборки м.в. определяется по формуле:
Второе отличие.
2) Но здесь величина "t" иначе связана с вероятностной оценкой, чем при нормальной выборке. Вероятностная оценка результатов малой выборки отличается от оценки в большой выборке тем, что при малом числе наблюдений распределение вероятностей для средней в большей степени зависит от числа отбираемых единиц. Английский статистик Голей, писавший под псевдонимом "Стьюдент", доказал, что в случаях малой выборки действует особый закон распределения вероятностей, который известен под названием распределения Стьюдента.
Согласно распределению "Стьюдента", вероятность того, что предельная ошибка не превысит t - кратную среднюю ошибку в малых выборках зависит и от величины ( t ), и от численности выборки ("n").
Рассмотрев величину , где .
Стыодент нашел закон ее распределения, на основании которого составлена таблица вероятностей, соответствующих данным значениям коэффициента доверия " t " и разным объемом малой выборки - n .
Таблица Cтьюдента приводится в курсах математической статистики.
t n | 0.5 | 1.0 | 1.5 | 2.0 | 2.5 | 3.0 |
0.347 | 0.609 | 0.769 | 0.861 | 0.933 | 0.942 | |
0.362 | 0.644 | 0.816 | 0.908 | 0.953 | 0.976 | |
0.372 | 0.656 | 0.832 | 0.924 | 0.966 | 0.984 | |
0.376 | 0.666 | 0.846 | 0.936 | 0.975 | 0.992 | |
0.377 | 0.671 | 0.850 | 0.940 | 0.978 | 0.992 | |
0.383 | 0.683 | 0.865 | 0.954 | 0.988 | 0.997 |
Как видно из таблицы, вероятность расхождения между выборочной средней малой выборки и генеральной средней зависит от числа отбираемых единиц n , колеблемости признака и величины самого t , которое имеет тот же смысл, что и в больших выборках. При в таблице даны вероятности нормального распределения.
Как видно из таблицы, при увеличении n - это распределение стремится к нормальному и при n= 20 уже мало чем отличается от него. Так, в обычной выборке при t =1 вероятность равна 0,683, при t = 2 вероятность равна 0,954 и при t = 3 вероятность равна 0,997.
Использование распределения Стьюдента можно рассмотреть на примере:
Предположим, отобрано по жребию 10 работниц - ткачих для определения средней выборки. У отдельных ткачих дневная выработка выражалась в м2 одинаковой ткани: 103, 93, 76, 87, 98, 69, 80, 110, 72, 82. Найдем выборочную среднюю и средний квадрат отклонений:
м2
м2
с вероятностью 0,924 можно утверждать, что - лежит в пределах , т.е. разность - не превысит -2 х 4,1 = -8,2 м2 и 2 х 4.1 = +8,2 м2.
Следовательно, в генеральной совокупности, из которой отобрано 10 работниц, средняя выработка будет находится в пределах: 87 8,2
Как видно из примера расчет ошибок - в малой выборке почти не отличается от расчета их в большой выборке. В малой выборке только вероятность нашего утверждения несколько меньше, чем в большой выборке (0,924 вместо 0,954), и расчет дисперсии ведется по-другому. Однако это не значит, что можно применять малую выборку там, где нужна большая. Малые выборки могут довольно широко применяться в технике, биологии, торговле, но их следует осторожно использовать в социально-экономических исследованиях.
Надо иметь ввиду также, что выводы по малой выборке действительны лишь в том случае если распределение признака в генеральной совокупности явл, нормальным или близким к нему, и то, что точность результатов при малой выборке все же ниже» чем при выборке большого объема.
Взаимопроникающие выборки. Если из одной генеральной совокупности производить одним и тем же способом несколько независимых друг от друга выборок, то такие выборки наз. взаимопроникающими.
Особенно часто взаимопроникающие выборки применяются в тех случаях, когда необходимо получить предварительные итоги при выборочных обследованиях. В таких случаях пользуются данными лишь одной выборки, хотя полной размер показателя представляется в виде результатов нескольких выборок
Взаимопроникающие выборки можно поручить разным лицам, что позволяет делать сопоставления итогов по всем частям и обеспечить взаимную проверку их работы.
Взаимопроникающие выборки дают независящие друг от друга оценки значений рассматриваемых признаков изучаемой совокупности. Такие оценки убедительны, так как полученные в результате обследования данные близки друг к другу.
Взаимопроникающие выборки особенно убедительны и удобны для сопоставления результатов исследования по отдельным географическим районам, т.к. они позволяют выявить межрайонную вариацию, проверить ее расчет по разным выборкам.
Но наряду с положительными сторонами взаимопроникающие выборки имеют недостатки: прежде всего, эти выборки связаны с повышенными расходами, так как одинаковой по величине частью генеральной совокупности занимается несколько обследователей, а следовательно, увеличиваются расходы на обследование одних и тех же единиц наблюдения.
Ошибки взаимопроникающих выборок .определяются по формулам типической пропорциональной выборки. Величина колеблемости признака определяется как средняя из колеблемости отдельных выборок, а средний размер - как средняя из средних.
Направленный отбор. Этот способ отбора единиц из генеральной совокупности исторически предшествовал другим способам. Его особенность состоит в том, что среднее значение признака в генеральной совокупности известно, а выборочная совокупность должна характеризовать структуру генеральной совокупности по другим признакам.
При использовании направленного отбора предполагают, что выборку нужно произвести таким образом, чтобы средний размер отобранных единиц был равен среднему размеру единиц во всей выборочной совокупности. Формирование выборочной совокупности производят путем замещения единиц совокупности слишком отклоняющихся по своим размерам от средней, другими единицами, которые как и первые отбираются в случайном или типическом порядке.
Для полученной выборки рассчитывают среднее значение изучаемого признака. Если оно не равно средней генеральной совокупности, то берут еще одну единицу и ее размер сравнивается с размером первой, взятой единицы. Если замена первой единицы вновь взятой приводит к равенству (приближенному) средних генеральной и выборочной совокупности, выборку считают уравновешенной и репрезентативной по всем остальным признакам совокупности. При отсутствии равенства средних замену повторяют до тех пор, пока не будет достигнута уравновешенность.
Уравновешивание можно производить по качественному признаку. Например, при изучении населения, состоящего из городского и сельского, когда единицами отбора служат административные районы с определенным числом жителей. В этом случае выборку можно уравновесить по % соотношению этих двух групп населения.
– Конец работы –
Эта тема принадлежит разделу:
ТЕМА ПРЕДМЕТ МЕТОД И ЗАДАЧИ СТАТИСТИКИ Возникновение статистики как науки... Организация статистики в Российской Федерации... Главным учетно статистическим центром в РФ является Государственный комитет Российской Федерации по статистике...
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: П. СПОСОБЫ ОТБОРА ЕДИНИЦ В ВЫБОРОЧНУЮ СОВОКУПНОСТЬ
Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Новости и инфо для студентов