Тема 9 Планирование выборки

1. Выделение объектов генеральной совокупности.

2. Определение процедуры формирования выборки.

3. Определение объема выборки.

 

1.

Планирование выборки включает следующие процедуры:

1. Выделение объектов генеральной совокупности.

2. Определение метода обследования.

3. Определение процедуры формирования выборки.

4. Определение объема выборки.

Выделение объектов генеральной совокупности

Генеральная совокупность — это множество всех единиц, являющих­ся объектами исследования.

На этом этапе подготовки исследования необходимо определить, какие субъекты составляют исследуемую генеральную совокупность. Как правило, субъекты, входящие в генеральную совокупность, не­однородны, поэтому при определении типичных представителей объек­та исследования некоторые группы могут быть упущены. Особенно сложно представить все элементы генеральной совокупности, состоя­щей из организаций, поскольку не все фирмы афишируют свою дея­тельность. В качестве генеральной совокупности могут быть опреде­лены рынок в целом, сегмент рынка или целевая группа субъектов.

Определение метода обследования

В зависимости от объема генеральной совокупности и целей исследо­вания могут быть использованы методы сплошного или выборочного обследования.

Метод сплошного обследования заключается в изучении всех еди­ниц генеральной совокупности. Метод связан с высокими затратами на проведение исследования, его использование оправдано, например, в случае малого количества потребителей, представляющих сегмент, или в случае, когда объем покупок данного клиента составляет значи­тельную долю от емкости рынка в целом.

Выборка — это группа объектов исследования, которая является носителем характеристик всех единиц генеральной совокупности, на­пример группа потребителей, представляющих интересы и вкусы все­го целевого рынка.

Метод выборочного обследования обеспечивает меньшую точность по сравнению с методом сплошного обследования, однако он менее трудоемок. Целесообразно использование данного метода при наличии большого числа однородных единиц генеральной совокупности.

Метод выборочного обследования предоставляет информацию о ге­неральной совокупности на основании обследования только ее части, поэтому данные, полученные в ходе выборочного обследования, имеют вероятностный характер. На практике это означает, что в результатеисследования определяется не конкретное значение, а интервал, в ко­тором находится искомое значение. Вероятность, с которой можно ут­верждать, что ошибка выборки не превысит некоторую заданную величину, называется доверительной вероятностью.

Свойство выборки отражать характеристики генеральной совокуп­ности называется репрезентативностью. Различие между характерис­тиками генеральной и выборочной совокупностей называется ошиб­кой выборки, которая зависит от выбранной процедуры составления (формирования) выборки.

2.

Процедура составления выборки — это последовательность отбора

респондентов в выборку. Отбор респондентов может сопровождаться систематическими и случайными ошибками. Систематические ошибки возникают при не­правильно выбранной процедуре составления выборки. Случайные ошибки существуют всегда, поскольку связаны с влиянием сложно-предсказуемых факторов. Влияние случайности полностью устранить невозможно, но величину случайной ошибки можно определить с по­мощью статистических методов. Систематическую ошибку невозмож­но оценить, но можно устранить, изменив процедуру выборки.

Учитывая наличие двух типов ошибок при формировании выбор­ки, выделяют случайные (вероятностные) и неслучайные (детерми­нированные) виды процедур составления выборки.

Неслучайные процедуры формирования выборки Неслучайные процедуры составления выборки самим процессом фор­мирования предполагают неслучайный выбор респондентов, чье мне­ние может отличаться от мнения генеральной совокупности в целом, порождая тем самым наличие неслучайной (систематической) ошиб­ки данных в результатах исследования. При использовании неслучай­ных процедур отбор респондентов в выборку производится на основе каких-либо принятых условий, ограничивающих круг вероятных уча­стников исследования. Например, в выборку отбираются только те респонденты, которые владеют компьютером или зашли в магазин с 10 до 11 часов.

Возможны следующие виды неслучайных выборок: • произвольная выборка — элементы выбираются без плана, бес­системно; способ недорог и удобен, но порождает неточность и нерепрезентативность;

• типовая выборка — набор ограничен лишь характерными (типич­ными) элементами генеральной совокупности; используется, на­пример, при формировании фокус-групп; требует, однако, нали­чия сведений о типичности изучаемых объектов;

• квотированная выборка — структура выборки строится по ана­логии с распределением определенных признаков в генеральной совокупности; от каждой группы генеральной совокупности от­бираются участники исследования, количество которых пропорци­онально представительству группы в генеральной совокупности.

Случайные процедуры формирования выборки

При формировании случайной выборки применяют следующие про­цедуры.

• простая выборка — элементы выбираются с помощью случайных чисел; при данном подходе предполагается, что для всех единиц генеральной совокупности вероятность быть избранной в выбо­рочную совокупность одинакова (значение вероятности равня­ется отношению объема выборки к объему генеральной совокуп­ности). Метод очень трудоемок и обязывает иметь список всех единиц генеральной совокупности;

• систематическая (механическая) выборка — первый элемент выбирается с помощью случайных чисел, остальные элементы выборки отбираются через равные интервалы (интервал скачка), которые равны отношению объема генеральной совокупности к объему выборки. Данный порядок формирования выборки зна­чительно упрощает процедуру, однако может внести искажения в структуру выборки, если генеральная совокупность упорядоче­на по какому-либо признаку.

Если генеральная совокупность упорядочена но существенному признаку (признак считается существенным, если он определяет со­стояние исследуемого показателя), то для уменьшения искажений выборочной характеристики следует отбирать единицы выборки из середины установленного интервала. Аналогично поступают и в том случае, когда генеральная совокупность упорядочена по второстепен­ному признаку, частично влияющему на изучаемый объект.

Если генеральная совокупность упорядочена по нейтральному при­знаку (который не оказывает влияния на поведение изучаемого объек­та), то допустимо включение в выборку любой единицы генеральной совокупности из установленного интервала;

• стратифицированная (типическая или групповая) выборка — ге­неральная совокупность делится на группы с набором определен­ных признаков (сегменты или страты), в каждой из которой с по­мощью случайного отбора формируется своя выборка; весовой коэффициент каждой страты в общем объеме выборки соответ­ствует ее удельному весу в генеральной совокупности;

• кластерная (серийная) выборка — генеральная совокупность де­лится на идентичные группы (гнезда, клумбы или кластеры). Кластеры должны быть по возможности однотипными, состав кластера должен быть подобен генеральной совокупности. Слу­чайным образом из генеральной совокупности отбираются не­сколько групп, которые подвергаются сплошному обследованию (одноступенчатый подход). Возможен и двухступенчатый под­ход, когда первоначально формируется выборка из кластеров,^ из нее случайным образом отбираются единицы исследования (т. е. единица выборки предыдущей стадии становится генераль­ной совокупностью для последующей). Недостаток этой проце­дуры формирования выборки — кластеры могут быть неоднород­ны между собой, однако эта процедура проста и экономична.

Многоступенчатые выборки

Любой тип выборки может быть как одно-, так и многоступенчатым. Многоступенчатая выборка применяется в тех случаях, когда извлечь выборку из генеральной совокупности прямым путем затруднитель­но, при этом все единицы отбора на каждой ступени равноценны для

обследования.

Многоступенчатый отбор, соединяющий различные процедуры фор­мирования выборки, делает выборку комбинированной. Такой вари­ант формирования выборки позволяет добиться наиболее рациональных и экономичных условий сбора данных в соответствии с поставленны­ми задачами.

Определение объема выборки

Определение размера выборки является некоторым компромиссом между теорией о точности результатов исследования и возможностью ее практической реализации по объему затрат на сбор информации.

Наиболее применимы следующие методы определения объема вы­борки:

1. Произвольный метод расчета; в этом случае объем выборки оп­ределяется на уровне 5-10 % от генеральной совокупности.

2. Традиционный метод расчета; связан с проведением периодиче­ских ежегодных исследований, охватывающих, например, 500, 1000 или 1500 респондентов.

3. Статистический метод расчета; основывается на определении ста­тистической надежности информации.

4. Метод расчета с помощью номограмм.

5. Эмпирический метод; в этом случае выборка считается достаточ­ной, когда все новые сведения вносят лишь незначительные из­менения (которыми можно пренебречь) в уже собранные резуль­таты исследования.

6. Затратный метод; основан на размере расходов, которые допус­тимо затратить на проведение исследования.

Статистический метод расчета объема выборки

На объем статистической выборки влияют следующие факторы:

1. Наличие сведений об объеме генеральной совокупности и степе­ни ее однородности.

2. Требуемая точность результатов, регулируемая величиной мак­симально допустимой ошибки репрезентативности и величиной доверительной вероятности, с которой делается заключение о до­стоверности результатов исследования.

3. Наличие сведений о средних показателях генеральной совокуп­ности по исследуемому признаку или об интервале варьирования признака (дисперсии).

4. Возможность повторного попадания единицы генеральной сово­купности в выборку.

При определении объема выборки для больших совокупностей (ког­да объем выборки составляет менее 5% генеральной совокупности) могут использоваться следующие формулы:

а) повторная выборка (при возможности повторного попадания еди­ницы генеральной совокупности в выборку) при неизвестном объеме генеральной совокупности, но известном распределении контролиру­емого признака:

п = Ц±, (4.1)

где t — нормированное отклонение, которое определяется по выбран­ному уровню доверительной вероятности (при 95% доверительной

вероятности t = 1,96; при 99% доверительной вероятности t = 2,58); р — найденная вариация генеральной совокупности, в % или в долях; q = 100 - р; Д — допустимая ошибка, в % или в долях;

б) повторная выборка при известной дисперсии изучаемого призна­ка (а):

в) бесповторная выборка (при исключении возможности повторно­го попадания единицы генеральной совокупности в выборку) при из­вестном объеме генеральной совокупности и известном распределе­нии контролируемого признака:

N = t2pq

где N — объем генеральной совокупности;

г) бесповторная выборка при известной дисперсии изучаемого при­знака:

N = tW

Выборка признается малой, если ее объем превышает 5% генераль­ной совокупности, в этом случае объем выборки может быть откор­ректирован:

(4.5)

где п' — объем выборки для малой совокупности, п — объем статисти­ческой выборки, N— объем генеральной совокупности.

Расчет статистической выборки при нормированном отклонении t = 2 и допустимой ошибке 5% (см. табл. 4.2) показывает, что для боль­ших совокупностей объем выборки может быть определен любым спо­собом, поскольку используемые практические приемы приводят ско­рее к завышению объема обследуемой совокупности.

Таблица 4.2 Зависимость размера выборки от величины генеральной совокупности

Объем генеральной совокупности 10 000 100 000 >
Объем выборки
Условия - при нормированном отклонении t = 2 и допустимой ошибке 5%.

 

Из табл. 4.2 видно, что при размере генеральной совокупности бо­лее 5000 ее величина не влияет на размер выборки, поэтому формула может принять следующий вид (величиной 1/JV можно пренебречь):

п = 1/А2.

(4.6)

Таким образом, при отсутствии точной информации о размере и ха­рактеристиках генеральной совокупности (при условии, что она не менее 5000) достаточно включить в выборку 400 ее представителей. Однако следует учесть, что если мы собираемся контролировать струк­туру выборки по нескольким параметрам, то объем выборки будет го­раздо больше. Г. А. Черчилль в своей работе «Маркетинговые иссле­дования» приводит на этот счет правило: «Объем выборки должен обеспечивать не менее 100 наблюдений для каждой первостепенной и не менее 20-50 наблюдений для каждой второстепенной классифи­кационной составляющей»; также следует сделать поправку на то, что отдельные респонденты, включенные в выборку, могут оказаться вне досягаемости или отказаться участвовать в исследовании.1

Количество респондентов, которых необходимо опросить для полу­чения необходимого количества положительных ответов на интересу­ющий вопрос, можно рассчитать по формуле:2

П

Р -Р

(4.7)

где П — требуемое для анализа количество положительных ответов; Рх — доля положительных ответов; Р2 — доля целевых групп, рассчи­тываемая как произведение всех долей респондентов, удовлетворя­ющих установленным требованиям (возраст, пол, статус пользовате­ля и т. д.).

Например, из проведенных ранее исследований известно, что рас­пределение ответов на интересующий исследователя вопрос (напри­мер о статусе пользователя) составило 60% и 40% (60% респондентов ответили утвердительно на вопрос о пользовании продуктом и 40% — отрицательно). Доля целевых респондентов в общем объеме респон­дентов составляет 70%. Для более детального анализа необходимо по­лучить 100 положительных ответов. Чтобы получить этот результат, требуется опросить 238 человек:

(4.8)

Использование номограмм для расчета объема выборки

Стремление упростить процедуру расчета объема выборки приводит к созданию таблиц, шкал или программ, которые ориентированы на обе­спечение статистической надежности информации, но при этом не обре­меняют пользователя знаниями специальных формул из области стати­стики. Например, существует калькулятор выборки (www. shortway. to/few/calculator, htm), на сайте Gallup (www. gallup. ru) можно найти таблицу, связывающую показатели размера выборки, распределения ответов с величиной стандартной ошибки (табл. 4.3).

Номограмма является графическим способом определения размера выборки. Номограмма включает три шкалы (рис. 4.4). На шкале слева

Таблица 4.3 Взаимосвязь показателей размера выборки, распределения ответов

            и стандартной ошибки
Распределе­ние ответов,     Размер выборки, ед.    
%
50:50 10,0 7,1 5,0 4,1 3,5 2,9 2,2   1,6
45:55 9,9 7,0 5,0 4,1 3,5 2,9 2,2   1,6
40:60 9,8 6,9 4,9 4,0 3,5 2,8 2,2    
35:65 9,5 6,7 4,8 3,9 3,4 2,8 2,1   1 5
30:70 9,2 6,5 4,6 3,7 3,2 2,6 2,0  
25:75 8,7 6,1 4,3 3,5 3,1 2,5 1,9  
20 : 80 8,0 5,7 4,0 3,3 2,8 2,3 1,8 ] ,3
15:85 7,1 5,0 3,6 2,9 2,5 2,1 1,6 ]
10:90 6,0 4,2 3,0 2,4 2,1 1,7 1,3 0,9
5:95 4,4 3,1 2,2 1,8 1,5 1,3 1,0 0,7

устанавливается разметка показателя среднеквадратического откло­нения или распределения доли признака. На правой шкале наносится разметка точности измерения в виде допустимой ошибки (половины интервала) при заданной доверительной вероятности 95 или 99%. На средней шкале делается разметка, соответствующая требуемому объ­ему выборки. На правой и левой шкалах'делаются отметки на уровне желаемых значений показателей (доли признака и допустимой ошиб­ки). Линейкой эти две отметки соединяются, на пересечении линейки со средней шкалой делается отметка, соответствующая тому объему выборки, который отвечает пожеланиям исследователя.