Пусть требуется изучить некоторую совокупность однородных объектов, объединённых по некоторому признаку Х.
Совокупность всех мысленно возможных объектов данного вида подлежащих изучению или возможных результатов всех мысленных наблюдений, производимых в неизменных условиях над одним объектом, называется генеральной совокупностью.
Производя ряд независимых опытов, или, как принято говорить, наблюдений, в каждом из которых величина Х принимает то или иное значение мы тем самым формируем выборочную совокупность объёма как часть (подмножество) генеральной совокупности объема N. Полученную совокупность часто называют статистическим рядом; последний играет роль исходного числового материала, подлежащего дальнейшей обработке и анализу.
Пример 1.Произвести анализ посещаемости занятий по математике (за первый месяц) студентами I курса.
Решение.Пусть все студенты I курса института представляют собой генеральную совокупность. Используя журналы посещаемости занятий, соберём данные пропусков у 25 случайно отобранных студентов, т.е. произведём выборку объёма И пусть дискретная случайная величина Х (число пропусков занятий) приняла следующие значения:
2,5,0,1,6,3,0,1,5,4,0,3,3,2,1,4,0,0,2,3,6,0,3,0,1.
Среди значений с.в. Х отбираются все различные:
Каждое значение обычно называют вариантом. Производим ранжирование вариант, располагая их в порядке возрастания: Затем опытные данные объединяем в группы так, чтобы в каждой отдельной группе значения случайной величины были одинаковые:
0,0,0,0,0,0,0,1,1,1,1,2,2,2,3,3,3,3,3,4,4,5,5,6,6.
Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом. Численность отдельной группы наблюдаемых данных называется частотой или весом соответствующего варианта и обозначается , где - индекс варианта, а их отношение к объёму выборки - относительными частотами.
Перечень вариантов и соответствующих им частот называется статистическим распределением выборки. Записывается статистическое распределение в виде таблиц. Для примера 1 они имеют вид:
а)
;
б)
.
Если число значений признака Х (с.в. Х) достаточно велико, а тем более если величина Х является непрерывной, то пользоваться таблицей частот в прежнем ее виде нецелесообразно. В этом случае для построения вариационного ряда применяют так называемый интервальный метод, суть которого заключается в следующем. Весь наблюдаемый диапазон изменения признака разбивают на некоторое число (k) интервалов, а затем определяют количество значений с.в. Х, попавших в каждый интервал, т.е. определяют интервальные частоты или относительные частоты .
Длину частичного интервала следует выбирать так, чтобы построенный ряд не был громоздким и в то же время, чтобы он, а в последствии и его графическое изображение, позволяли выявить характерные черты изменения значений с.в. Х, на основании которых будут сделаны выводы о характерных особенностях изучаемой генеральной совокупности или изучаемого явления.
Пример 2. При исследовании стабильности источника напряжения было проведено наблюдений. В результате были получены следующие отклонения напряжения от номинального значения (мкв), представленные таблицей:
Используя статистические данные, построить интервальный вариационный статистический ряд распределения с.в. Х - отклонения напряжения от номинального значения.
Решение. Рассматривается непрерывная случайная величина Х - отклонение напряжения от номинального значения. Построим для неё интервальный вариационный ряд. Количество интервалов, на которые надо разбить всю область изменения с.в. Х: для примем значение . Анализируя статистические данные, получаем, что Простые расчеты показывают. Что длина частичного интервала . Тогда согласно принятых условий а Преобразованный интервал варьирования разбиваем на 8 частичных интервалов длиной . Шкала интервалов и группировка результатов наблюдений приведены в таблицах а) и б).
а)
Отклонение напряжения | ||||||||
б)
Отклонение напряжения | ||||||||
0,060 | 0,100 | 0,193 | 0,233 | 0,213 | 0,127 | 0,053 | 0,020 |