Тема 9 Планирование выборки

1. Выделение объектов генеральной совокупности.

2. Определение процедуры формирования выборки.

3. Определение объема выборки.

Планирование выборки включает следующие процедуры:

1. Выделение объектов генеральной совокупности.

2. Определение метода обследования.

3. Определение процедуры формирования выборки.

4. Определение объема выборки.

Выделение объектов генеральной совокупности

Генеральная совокупность — это множество всех единиц, являющихся объектами исследования.

На этом этапе подготовки исследования необходимо определить, какие субъекты составляют исследуемую генеральную совокупность. Как правило, субъекты, входящие в генеральную совокупность, неоднородны, поэтому при определении типичных представителей объекта исследования некоторые группы могут быть упущены. Особенно сложно представить все элементы генеральной совокупности, состоящей из организаций, поскольку не все фирмы афишируют свою деятельность. В качестве генеральной совокупности могут быть определены рынок в целом, сегмент рынка или целевая группа субъектов.

Определение метода обследования

В зависимости от объема генеральной совокупности и целей исследования могут быть использованы методы сплошного или выборочного обследования.

Метод сплошного обследования заключается в изучении всех единиц генеральной совокупности. Метод связан с высокими затратами на проведение исследования, его использование оправдано, например, в случае малого количества потребителей, представляющих сегмент, или в случае, когда объем покупок данного клиента составляет значительную долю от емкости рынка в целом.

Выборка — это группа объектов исследования, которая является носителем характеристик всех единиц генеральной совокупности, например группа потребителей, представляющих интересы и вкусы всего целевого рынка.

Метод выборочного обследования обеспечивает меньшую точность по сравнению с методом сплошного обследования, однако он менее трудоемок. Целесообразно использование данного метода при наличии большого числа однородных единиц генеральной совокупности.

Метод выборочного обследования предоставляет информацию о генеральной совокупности на основании обследования только ее части, поэтому данные, полученные в ходе выборочного обследования, имеют вероятностный характер. На практике это означает, что в результатеисследования определяется не конкретное значение, а интервал, в котором находится искомое значение. Вероятность, с которой можно утверждать, что ошибка выборки не превысит некоторую заданную величину, называется доверительной вероятностью.

Свойство выборки отражать характеристики генеральной совокупности называется репрезентативностью. Различие между характеристиками генеральной и выборочной совокупностей называется ошибкой выборки, которая зависит от выбранной процедуры составления (формирования) выборки.

Процедура составления выборки — это последовательность отбора

респондентов в выборку. Отбор респондентов может сопровождаться систематическими и случайными ошибками. Систематические ошибки возникают при неправильно выбранной процедуре составления выборки. Случайные ошибки существуют всегда, поскольку связаны с влиянием сложно-предсказуемых факторов. Влияние случайности полностью устранить невозможно, но величину случайной ошибки можно определить с помощью статистических методов. Систематическую ошибку невозможно оценить, но можно устранить, изменив процедуру выборки.

Учитывая наличие двух типов ошибок при формировании выборки, выделяют случайные (вероятностные) и неслучайные (детерминированные) виды процедур составления выборки.

Неслучайные процедуры формирования выборки Неслучайные процедуры составления выборки самим процессом формирования предполагают неслучайный выбор респондентов, чье мнение может отличаться от мнения генеральной совокупности в целом, порождая тем самым наличие неслучайной (систематической) ошибки данных в результатах исследования. При использовании неслучайных процедур отбор респондентов в выборку производится на основе каких-либо принятых условий, ограничивающих круг вероятных участников исследования. Например, в выборку отбираются только те респонденты, которые владеют компьютером или зашли в магазин с 10 до 11 часов.

Возможны следующие виды неслучайных выборок: • произвольная выборка — элементы выбираются без плана, бессистемно; способ недорог и удобен, но порождает неточность и нерепрезентативность;

• типовая выборка — набор ограничен лишь характерными (типичными) элементами генеральной совокупности; используется, например, при формировании фокус-групп; требует, однако, наличия сведений о типичности изучаемых объектов;

• квотированная выборка — структура выборки строится по аналогии с распределением определенных признаков в генеральной совокупности; от каждой группы генеральной совокупности отбираются участники исследования, количество которых пропорционально представительству группы в генеральной совокупности.

Случайные процедуры формирования выборки

При формировании случайной выборки применяют следующие процедуры.

• простая выборка — элементы выбираются с помощью случайных чисел; при данном подходе предполагается, что для всех единиц генеральной совокупности вероятность быть избранной в выборочную совокупность одинакова (значение вероятности равняется отношению объема выборки к объему генеральной совокупности). Метод очень трудоемок и обязывает иметь список всех единиц генеральной совокупности;

• систематическая (механическая) выборка — первый элемент выбирается с помощью случайных чисел, остальные элементы выборки отбираются через равные интервалы (интервал скачка), которые равны отношению объема генеральной совокупности к объему выборки. Данный порядок формирования выборки значительно упрощает процедуру, однако может внести искажения в структуру выборки, если генеральная совокупность упорядочена по какому-либо признаку.

Если генеральная совокупность упорядочена но существенному признаку (признак считается существенным, если он определяет состояние исследуемого показателя), то для уменьшения искажений выборочной характеристики следует отбирать единицы выборки из середины установленного интервала. Аналогично поступают и в том случае, когда генеральная совокупность упорядочена по второстепенному признаку, частично влияющему на изучаемый объект.

Если генеральная совокупность упорядочена по нейтральному признаку (который не оказывает влияния на поведение изучаемого объекта), то допустимо включение в выборку любой единицы генеральной совокупности из установленного интервала;

• стратифицированная (типическая или групповая) выборка — генеральная совокупность делится на группы с набором определенных признаков (сегменты или страты), в каждой из которой с помощью случайного отбора формируется своя выборка; весовой коэффициент каждой страты в общем объеме выборки соответствует ее удельному весу в генеральной совокупности;

• кластерная (серийная) выборка — генеральная совокупность делится на идентичные группы (гнезда, клумбы или кластеры). Кластеры должны быть по возможности однотипными, состав кластера должен быть подобен генеральной совокупности. Случайным образом из генеральной совокупности отбираются несколько групп, которые подвергаются сплошному обследованию (одноступенчатый подход). Возможен и двухступенчатый подход, когда первоначально формируется выборка из кластеров,^ из нее случайным образом отбираются единицы исследования (т. е. единица выборки предыдущей стадии становится генеральной совокупностью для последующей). Недостаток этой процедуры формирования выборки — кластеры могут быть неоднородны между собой, однако эта процедура проста и экономична.

Многоступенчатые выборки

Любой тип выборки может быть как одно-, так и многоступенчатым. Многоступенчатая выборка применяется в тех случаях, когда извлечь выборку из генеральной совокупности прямым путем затруднительно, при этом все единицы отбора на каждой ступени равноценны для

обследования.

Многоступенчатый отбор, соединяющий различные процедуры формирования выборки, делает выборку комбинированной. Такой вариант формирования выборки позволяет добиться наиболее рациональных и экономичных условий сбора данных в соответствии с поставленными задачами.

Определение объема выборки

Определение размера выборки является некоторым компромиссом между теорией о точности результатов исследования и возможностью ее практической реализации по объему затрат на сбор информации.

Наиболее применимы следующие методы определения объема выборки:

1. Произвольный метод расчета; в этом случае объем выборки определяется на уровне 5-10 % от генеральной совокупности.

2. Традиционный метод расчета; связан с проведением периодических ежегодных исследований, охватывающих, например, 500, 1000 или 1500 респондентов.

3. Статистический метод расчета; основывается на определении статистической надежности информации.

4. Метод расчета с помощью номограмм.

5. Эмпирический метод; в этом случае выборка считается достаточной, когда все новые сведения вносят лишь незначительные изменения (которыми можно пренебречь) в уже собранные результаты исследования.

6. Затратный метод; основан на размере расходов, которые допустимо затратить на проведение исследования.

Статистический метод расчета объема выборки

На объем статистической выборки влияют следующие факторы:

1. Наличие сведений об объеме генеральной совокупности и степени ее однородности.

2. Требуемая точность результатов, регулируемая величиной максимально допустимой ошибки репрезентативности и величиной доверительной вероятности, с которой делается заключение о достоверности результатов исследования.

3. Наличие сведений о средних показателях генеральной совокупности по исследуемому признаку или об интервале варьирования признака (дисперсии).

4. Возможность повторного попадания единицы генеральной совокупности в выборку.

При определении объема выборки для больших совокупностей (когда объем выборки составляет менее 5% генеральной совокупности) могут использоваться следующие формулы:

а) повторная выборка (при возможности повторного попадания единицы генеральной совокупности в выборку) при неизвестном объеме генеральной совокупности, но известном распределении контролируемого признака:

п = Ц±, (4.1)

где t — нормированное отклонение, которое определяется по выбранному уровню доверительной вероятности (при 95% доверительной

вероятности t = 1,96; при 99% доверительной вероятности t = 2,58); р — найденная вариация генеральной совокупности, в % или в долях; q = 100 - р; Д — допустимая ошибка, в % или в долях;

б) повторная выборка при известной дисперсии изучаемого признака (а):

в) бесповторная выборка (при исключении возможности повторного попадания единицы генеральной совокупности в выборку) при известном объеме генеральной совокупности и известном распределении контролируемого признака:

N = t²pq

где N — объем генеральной совокупности;

г) бесповторная выборка при известной дисперсии изучаемого признака:

N = tW

Выборка признается малой, если ее объем превышает 5% генеральной совокупности, в этом случае объем выборки может быть откорректирован:

(4.5)

где п' — объем выборки для малой совокупности, п — объем статистической выборки, N— объем генеральной совокупности.

Расчет статистической выборки при нормированном отклонении t = 2 и допустимой ошибке 5% (см. табл. 4.2) показывает, что для больших совокупностей объем выборки может быть определен любым способом, поскольку используемые практические приемы приводят скорее к завышению объема обследуемой совокупности.

Таблица 4.2 Зависимость размера выборки от величины генеральной совокупности

Объем генеральной совокупности	10 000	100 000	>
Объем выборки
Условия - при нормированном отклонении t = 2 и допустимой ошибке 5%.

Из табл. 4.2 видно, что при размере генеральной совокупности более 5000 ее величина не влияет на размер выборки, поэтому формула может принять следующий вид (величиной 1/JV можно пренебречь):

п = 1/А².

(4.6)

Таким образом, при отсутствии точной информации о размере и характеристиках генеральной совокупности (при условии, что она не менее 5000) достаточно включить в выборку 400 ее представителей. Однако следует учесть, что если мы собираемся контролировать структуру выборки по нескольким параметрам, то объем выборки будет гораздо больше. Г. А. Черчилль в своей работе «Маркетинговые исследования» приводит на этот счет правило: «Объем выборки должен обеспечивать не менее 100 наблюдений для каждой первостепенной и не менее 20-50 наблюдений для каждой второстепенной классификационной составляющей»; также следует сделать поправку на то, что отдельные респонденты, включенные в выборку, могут оказаться вне досягаемости или отказаться участвовать в исследовании.¹

Количество респондентов, которых необходимо опросить для получения необходимого количества положительных ответов на интересующий вопрос, можно рассчитать по формуле:²

Р -Р

(4.7)

где П — требуемое для анализа количество положительных ответов; Р_х — доля положительных ответов; Р₂ — доля целевых групп, рассчитываемая как произведение всех долей респондентов, удовлетворяющих установленным требованиям (возраст, пол, статус пользователя и т. д.).

Например, из проведенных ранее исследований известно, что распределение ответов на интересующий исследователя вопрос (например о статусе пользователя) составило 60% и 40% (60% респондентов ответили утвердительно на вопрос о пользовании продуктом и 40% — отрицательно). Доля целевых респондентов в общем объеме респондентов составляет 70%. Для более детального анализа необходимо получить 100 положительных ответов. Чтобы получить этот результат, требуется опросить 238 человек:

(4.8)

Использование номограмм для расчета объема выборки

Стремление упростить процедуру расчета объема выборки приводит к созданию таблиц, шкал или программ, которые ориентированы на обеспечение статистической надежности информации, но при этом не обременяют пользователя знаниями специальных формул из области статистики. Например, существует калькулятор выборки (www. shortway. to/few/calculator, htm), на сайте Gallup (www. gallup. ru) можно найти таблицу, связывающую показатели размера выборки, распределения ответов с величиной стандартной ошибки (табл. 4.3).

Номограмма является графическим способом определения размера выборки. Номограмма включает три шкалы (рис. 4.4). На шкале слева

Таблица 4.3 Взаимосвязь показателей размера выборки, распределения ответов

						и стандартной	ошибки
Распределение ответов,			Размер выборки,	ед.
%
50:50	10,0	7,1	5,0	4,1	3,5	2,9	2,2		1,6
45:55	9,9	7,0	5,0	4,1	3,5	2,9	2,2		1,6
40:60	9,8	6,9	4,9	4,0	3,5	2,8	2,2
35:65	9,5	6,7	4,8	3,9	3,4	2,8	2,1		1 5
30:70	9,2	6,5	4,6	3,7	3,2	2,6	2,0
25:75	8,7	6,1	4,3	3,5	3,1	2,5	1,9
20 : 80	8,0	5,7	4,0	3,3	2,8	2,3	1,8	]	,3
15:85	7,1	5,0	3,6	2,9	2,5	2,1	1,6	]
10:90	6,0	4,2	3,0	2,4	2,1	1,7	1,3	0,9
5:95	4,4	3,1	2,2	1,8	1,5	1,3	1,0	0,7

устанавливается разметка показателя среднеквадратического отклонения или распределения доли признака. На правой шкале наносится разметка точности измерения в виде допустимой ошибки (половины интервала) при заданной доверительной вероятности 95 или 99%. На средней шкале делается разметка, соответствующая требуемому объему выборки. На правой и левой шкалах'делаются отметки на уровне желаемых значений показателей (доли признака и допустимой ошибки). Линейкой эти две отметки соединяются, на пересечении линейки со средней шкалой делается отметка, соответствующая тому объему выборки, который отвечает пожеланиям исследователя.