Подготовка исходных данных и проверка статистических гипотез

Выбор того или иного метода для исследования функциональных характеристик обслуживающей системы независимо от того, является ли он аналитическим или же относится к категории имитационных, в каждом конкретном случае определяется законом распределения моментов поступления требований и продолжительностей обслуживания. Чтобы установить, какой характер имеют упомянутые выше распределения, необходимо осуществить наблюдения за реально функционирующей СМО и зарегистрировать ряд чисел, получаемых в ходе наблюдений. В связи с накоплением данных, характеризующих процесс массового обслуживания, как правило возникают следующие вопросы:

1. Когда осуществлять наблюдение за системой?

2. Каким образом систематизировать данные?

В большинстве случаев СМО характеризуются так называемыми периодами повышенной загруженности, когда интенсивность потока требований по сравнению с другими интервалами рабочего дня существенно возрастает. Отметим, например, что интенсивность потоков транспортных средств на магистральных автострадах при въезде в крупные города достигает пиковых значений в интервалах времени около 8 ч утра и 5ч вчера. В таких случаях сбор информации об исследуемом процессе необходимо осуществлять именно в периоды наибольшей загруженности. Можно расценить такую стратегию сбора данных как чрезмерно "консервативную"; однако следует помнить, что заторы на крупных автомагистралях возникает именно в течение периодов повышенной загруженности обслуживающей системы. Поэтому системы такого рода должны проектироваться с учетом тех экстремальных условий, которые могут возникнуть в процессе их функционирования.

Сбор данных о входном и выходных потоках в СМО может осуществляться одним из указанных ниже способов, а именно:

а) путем регистрации временных интервалов между последовательными поступлениями заявок на обслуживание и последовательными выходами обслуженных "клиентов" из системы;

б) путем подсчета числа поступивших в единицу времени заявок на обслуживание и числа выходящих из системы (в единицу времени) обслуженных клиентов.

Первый способ ориентирован на определение распределений временных отрезков между последовательными поступлениями требований и распределений продолжительностей обслуживания, тогда как второй способ позволяет получить распределение числа прибытий в систему заявок на обслуживание и числа выбытий обслуженных "клиентов" из системы.

Процедура сбора данных может основываться как на примитивном способе фиксации наблюдателем времени с помощью обычного секундомера, так и на использовании автоматических регулирующих устройств.

После того как с помощью одного из упомянутых выше способов требуемая информация оказывается в распоряжении исследователя, ее необходимо систематизировать и обобщить, с тем чтобы получить возможность построить в результате интересующие исследователя распределение вероятностей. Обычно это достигается путем представления результатов анализа накопленных данных в виде частотных гистограмм. Затем выбирается "териотическое" распределение, которое хорошо подходит для описания полученных данных. Далее с целью проверки степени пригодности выбранного распределения для описания реального процесса применяется одна из стандартных тестовых процедур.

Пример. Для регистрации интенсивности транспортных потоков на перекрестке используется специальный автомат-регистратор. Это устройство регистрирует моменты прибытия к перекрестку транспортных средств (для определенности будем говорить об автомобилях) на непрерывной временной шкале, имеющей нулевую точку отсчета. В табл 1. приведены результаты регистрации моментов прибытия (в минутах) для первых шестидесяти автомобилей.

Таблица 1.

Порядковый номер прибытия Время прибытия, мин Порядковый номер прибытия Время прибытия, мин Порядковый номер прибытия Время прибытия, мин Порядковый номер прибытия Время прибытия, мин
5,2 67,6 132,7 227,8
6,7 69,3 142,3 233,5
9,1 78,6 145,2 239,8
12,5 86,6 154,3 243,6
18,9 91,3 155,6 250,5
22,6 97,2 166,2 255,8
27,4 97,9 169,2 256,5
29,9 111,5 169,5 256,9
35,4 116,7 172,4 270,3
35,7 117,3 175,3 275,1
44,4 118,2 180,1 277,1
47,1 124,1 188,8 278,1
47,5 127,4 201,2 283,6
49,7 127,6 218,4 299,8
67,1 127,8 219,9 300,0

 

Данные, приведенные в табл 1. можно использовать для нахождения распределения числа прибытий в единицу времени. Для этого прежде всего выбирается единица измерения времени. В рассматриваемом примере за единицу времени принимается 1ч. из табл 1. видно, что в течение первого часа зарегистрировано 14 прибытий, второго часа - 12 прибытий, третьего часа - 14 прибытий, в течение четвертого часа - 8 прибытий, в течение пятого часа - 12 прибытий. Это означает, что в рассматриваемом пятичасовом интервале число прибытий в 1 ч оказалось равным 8с с частотой 1, 12 с частотой 2 и 14 с частотой 2.

Теперь представим себе, что мы имеем полную информацию относительно времени каждого из наблюдавшихся прибытий и для каждого числа прибытий в час n определена соответствующая частота fn (табл 2). Наша цель заключается в том, чтобы с помощью c2- критерия проверить, что эти данные соответствуют конкретному закону распределения.

Таблица 2.

n fn
n fn ³17

Допустим, что нам хотелось бы проверить справедливость гипотезы о том, что выборка, содержащаяся в табл 2, соответствует пуассоновскому распределению вероятностей. Проверка заключается в сопоставлении наблюдаемой частоты fn с ожидаемым значением частоты, получаемой при допущении, что имеет место пуассоновское расспределение вероятностей.

Таблица 3

n pn N pn N pn
0.0000 0.0303 0.1138
0.0001 0.0504 0.1020
0.0006 0.0734 0.0848
0.0023 0.0950 0.0659
0.0067 0.1106 0.0479
0.0156 0.1172 0.0834

 
 

Для получения ожидаемого значения частоты в предположении, что закон распределения является пуассоновским, сначала оценим, что распределение n для пуассоновское распределения по данной выборке. При этом получаем


Затем вычистим вероятности pn для пуассоновского распределения со средним значением n=11,65 автомобиля в 1 ч. результаты вычислений приведены в табл 3. заметим, что


Поскольку полное число наблюдений равняется 63, ожидаемое значение частоты определяется по формуле

 
 

Теперь нетрудно вычислить значения c2 по формуле

Потребуем, чтобы fn были не менее пяти. В противном случае образуем группы последовательных значений fn, для которых это условие окажется выполненным. Так, например, в табл 3. Следует объединить в одну группу последовательность значений n от нулю до восьми, в результате чего для наблюдаемой частоты будем иметь значение, равное 7=(1+3+3); образуя группу для всех n, превышающих 14, получим для fn значение, также равное 7=(6+1). Теперь обратимся к таблице 4 , иллюстрирующей полученные значения c2.

Таблица 4.

n Fn en (fn-en)2 en
0-4    
   
0 7 11,3 1,636
   
   
5,99 0,000
6,97 0,557
7,17 0,356
6,43 1,117
5,34 3,248
  1,325
15    
1 7 12,42 2,365
³17    
Суммарные значения 10,6(значения c2)

 
 

Сравним теперь полученные значения c2 с критическим значением для c2-распределения. Для этого требуется задать уровень значимости a и число степеней свободы n. Величина n задается соотношением


В рассматриваемом примере мы имеем восемь составных интервалов. Поскольку среднее значение для пуассоновского распределения вероятностей оценивалось на заданной выборке, имеем n=8-1-1=6. Положив уровень значимости a равным 0,05, из таблицы значений c2 получаем критическое значение

При использовании c2-критерия выдвигаемая гипотеза относительно характера распределения при заданном уровне значимости a принимается, если значение c2£c2n(a). Поскольку это условие в нашем примере выполняется, принимается гипотеза о том, что приведенная выше выборка соответствует пуассоновскому закону распределения со средним n, равным 11,65 прибытий в 1ч.