ПЕРВИЧНАЯ ОБРАБОТКА СТАТИСТИЧЕСКИХ ДАННЫХ. СТАТИСТИЧЕСКИЙ АНАЛОГ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Пусть требуется изучить некоторую совокупность однородных объектов, объединённых по некоторому признаку Х.

Совокупность всех мысленно возможных объектов данного вида подлежащих изучению или возможных результатов всех мысленных наблюдений, производимых в неизменных условиях над одним объектом, называется генеральной совокупностью.

Производя ряд независимых опытов, или, как принято говорить, наблюдений, в каждом из которых величина Х принимает то или иное значение мы тем самым формируем выборочную совокупность объёма как часть (подмножество) генеральной совокупности объема N. Полученную совокупность часто называют статистическим рядом; последний играет роль исходного числового материала, подлежащего дальнейшей обработке и анализу.

Пример 1.Произвести анализ посещаемости занятий по математике (за первый месяц) студентами I курса.

Решение.Пусть все студенты I курса института представляют собой генеральную совокупность. Используя журналы посещаемости занятий, соберём данные пропусков у 25 случайно отобранных студентов, т.е. произведём выборку объёма И пусть дискретная случайная величина Х (число пропусков занятий) приняла следующие значения:

2,5,0,1,6,3,0,1,5,4,0,3,3,2,1,4,0,0,2,3,6,0,3,0,1.

Среди значений с.в. Х отбираются все различные:

Каждое значение обычно называют вариантом. Производим ранжирование вариант, располагая их в порядке возрастания: Затем опытные данные объединяем в группы так, чтобы в каждой отдельной группе значения случайной величины были одинаковые:

0,0,0,0,0,0,0,1,1,1,1,2,2,2,3,3,3,3,3,4,4,5,5,6,6.

Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом. Численность отдельной группы наблюдаемых данных называется частотой или весом соответствующего варианта и обозначается , где - индекс варианта, а их отношение к объёму выборки - относительными частотами.

Перечень вариантов и соответствующих им частот называется статистическим распределением выборки. Записывается статистическое распределение в виде таблиц. Для примера 1 они имеют вид:

а)

 
 

 

;

б)

 
               

 

.

Если число значений признака Х (с.в. Х) достаточно велико, а тем более если величина Х является непрерывной, то пользоваться таблицей частот в прежнем ее виде нецелесообразно. В этом случае для построения вариационного ряда применяют так называемый интервальный метод, суть которого заключается в следующем. Весь наблюдаемый диапазон изменения признака разбивают на некоторое число (k) интервалов, а затем определяют количество значений с.в. Х, попавших в каждый интервал, т.е. определяют интервальные частоты или относительные частоты .

Длину частичного интервала следует выбирать так, чтобы построенный ряд не был громоздким и в то же время, чтобы он, а в последствии и его графическое изображение, позволяли выявить характерные черты изменения значений с.в. Х, на основании которых будут сделаны выводы о характерных особенностях изучаемой генеральной совокупности или изучаемого явления.

Пример 2. При исследовании стабильности источника напряжения было проведено наблюдений. В результате были получены следующие отклонения напряжения от номинального значения (мкв), представленные таблицей:

Используя статистические данные, построить интервальный вариационный статистический ряд распределения с.в. Х - отклонения напряжения от номинального значения.

Решение. Рассматривается непрерывная случайная величина Х - отклонение напряжения от номинального значения. Построим для неё интервальный вариационный ряд. Количество интервалов, на которые надо разбить всю область изменения с.в. Х: для примем значение . Анализируя статистические данные, получаем, что Простые расчеты показывают. Что длина частичного интервала . Тогда согласно принятых условий а Преобразованный интервал варьирования разбиваем на 8 частичных интервалов длиной . Шкала интервалов и группировка результатов наблюдений приведены в таблицах а) и б).

а)

Отклонение напряжения                
 

 

б)

Отклонение напряжения                
  0,060 0,100 0,193 0,233 0,213 0,127 0,053 0,020