рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Статистическое распределение выборки.

Статистическое распределение выборки. - раздел Математика, Теория вероятности. Возникновение математики случайного Эмпирическая Функция Распределения/ Пусть Изучается...

Эмпирическая функция распределения/

Пусть изучается некоторая св. X. С этой целью над с. в. X про­изводится ряд независимых опытов (наблюдений). В каждом из этих опытов величина X принимает то или иное значение.

Пусть она приняла n1 раз значение x1, n2 раз — значение x2, …, nk раз — значение xk. При этом n1 + n2 +…+ nk =n— объем выборки. Значения x1, x2, …, xk называются вариантами св. X.

Вся совокупность значений с.в. X представляет собой первичный статистический материал, который подлежит дальнейшей обработке, прежде всего — упорядочению.

Операция расположения значений случайной величины (признака) по неубыванию называется ранжированием статистических дан­ных. Полученная таким образом последовательность x(1), x(2), …, x(n) значений с. в. X (где x(1) £ x(2) £ …£ x(n) и x(1) =,…, x(n) =называется вариационным рядом.

Числа ni , показывающие, сколько раз встречаются варианты xi в ряде наблюдений, называются частотами, а отношение их к объему выборки — частностями или относительными частотами i*), т.е.

(6.1)

 

где n=

Перечень вариантов и соответствующих им частот или частостей называется статистическим распределением выборки или статистическим рядом.

Записывается статистическое распределение в виде таблицы. Первая строка содержит варианты, а вторая — их частоты ni (или частости рi*).

Пример 6.2. В результате тестирования (см. пример 6.1) группа аби­туриентов набрала баллы: 5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Записать полученную выборку в виде: а) вариационного ряда; б) статистического ряда.

а) Проранжировав статистические данные (т. е. исходный ряд), получим вариационный ряд (x(1), x(2), …, x(10)):

(0, 1, 1, 2, 3, 4, 4, 5, 5, 5).

б) Подсчитав частоту и частость вариантов x1=0, x2=1, x3 =2, x4=3, x5 =4, x6 =5, получим статистическое распределение выборки) (так называемый дискретный статистический ряд)

xi
ni

или

xi
рi*

Статистическое распределение выборки является оценкой неизвестного распределения. В соответствии с теоремой Бернулли (п. 5.3) относительные частоты рi* сходятся при n → ∞ к соответствующим вероятностям рi, т.е. рi*рi. Поэтому при больших значениях п статистическое распределение мало отличается от истинного распре­деления.

В случае, когда число значений признака (с. в. X) велико или при­знак является непрерывным (т. е. когда с. в. X может принять любое значение в некотором интервале), составляют интервальный стати­стический ряд. В первую строку таблицы статистического распределе­ния вписывают частичные промежутки [x0, x1), [x1, x2), …, [xk-1, xk), которые берут обычно одинаковыми по длине: h = x1 – x0 = х2 — x1 = .... Для определения величины интервала (h) можно использовать формулу Стерджеса:

,

где хmах — xmin — разность между наибольшим и наименьшим значени­ями признака, m= 1 + log2 n — число интервалов (log2 n ≈ 3,322 lg n). За начало первого интервала рекомендуется брать величину xнач = xmin. Во второй строчке статистического ряда вписывают количество наблюдений ni (i =1,…,k), попавших в каждый интервал.

Пример 6.3. Измерили рост (с точностью до см) 30 наудачу отобран­ных студентов. Результаты измерений таковы:

178, 160, 154, 183, 155, 153, 167, 186, 163, 155,

157, 175, 170, 166, 159, 173, 182, 167, 171, 169,

179, 165, 156, 179, 158, 171, 175, 173, 164, 172.

Построить интервальный статистический ряд.

Для удобства проранжируем полученные данные:

153, 154, 155, 155, 156, 157, 158, 159, 160, 163, 164, 165. 166. 167, 167, 169,

170, 171, 171, 172, 173, 173, 175, 175, 178, 179, 179, 182, 183, 186.

Отметим, что X — рост студента — непрерывная с. в. При более точном измерении роста значения с. в. X обычно не повторяются (веро­ятность наличия на Земле двух человек, рост которых равен, скажем = 1,732050808... метров, равна нулю!).

Как видим, хтiп = 153, хmах = 186; по формуле Стерджеса, при п = 30, находим длину частичного интервала

Примем h = 6. Тогда хнач = 153-= 150. Исходные данные

разбиваем на 6 (т = 1 + log230 = 5,907 ≈ 6) интервалов: [150,156), [156,162), [162,168), [168,174), [174, 180), [180, 186).

 

Подсчитав число студентов (ni), попавших в каждый из полученных промежутков, получим интервальный статистический ряд:

Рост [150-156) [156-162) [162-168) [168-174) [174-180) [180-186)
Частота
Частость 0,13 0,17 0,20 0,23 0,17 0,10

Одним из способов обработки вариационного ряда является построение эмпирической функции распределения.

Эмпирической (статистической) функцией распределения называется функция Fn* (х), определяющая для каждого значения х частость события {X < х}:

Fn* (х)=p*{X<x}. (6.2)

Для нахождения значений эмпирической функции удобно Fn* (х) писать в виде

Fn* (х)=

где n — объем выборки, nх — число наблюдений, меньших x (x Î R) Очевидно, что Fn* (х) удовлетворяет тем же условиям, что и истинная функция распределения F(x) (см. п. 2.3).

При увеличении числа п наблюдений (опытов) относительная частота события {X < х} приближается к вероятности этого события (теорема Бернулли, п. 5.3). Эмпирическая функция распределения- Fn* (х) является оценкой вероятности события {X < х}, т.е. оценкой теоретической функции распределения F(x) с.в. X, Имеет место

Теорема 6.1 (Гливенко).Пусть F(x) — теоретическая функция рас­пределения с.в. X, а Fn* (х) — эмпирическая. Тогда для любого e > 0

lim { |Fn* (х)-F(x)|>e} = 0.

Пример 6.4.Построить функцию Fn* (х), используя условие и результаты примера 6.2.

Здесь п = 10. Имеем F*10(x) = = 0 при х£ 0 (наблюдений меньше 0 нет); F*10(x) = при 0 < х£ 1 (здесь nх = 1) и т. д. Окончательно получаем

График эмпирической функции распределения

приведен на рис. 59.

 

 

– Конец работы –

Эта тема принадлежит разделу:

Теория вероятности. Возникновение математики случайного

Теория вероятности как и другие науки возникла из потребностей практики Ее элементы были знакомы еще первобытным людям шансы убить зверя у двух.. Возникновение математики случайного относится к середине века и связано с.. Пример одной из ситуаций два игрока договорились играть в кости до тех пор пока одному не удастся выиграть три..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Статистическое распределение выборки.

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Предмет теории вероятности
Любая наука изучает не сами явления, протекающие в природе, в обществе, а их математические модели, т.е. описание явлений при помощи набора строго определенных символов и операций над ними.

Действия над событиями
Введем основные операции над событиями; они полностью соответ­ствуют основным операциям над множествами. Суммой событий А и В называется событие С = А +

Статистическое определение вероятности
Для математического изучения случайного события необходимо ввести какую-либо количественную оценку события. Понятно, что одни события имеют больше шансов («более вероятны») наступить, чем дру­гие.

Элементы комбинаторики
Согласно классическому определению подсчет вероятности собы­тия А сводится к подсчету числа благоприятствующих ему исходов. Делают это обычно комбинаторными методами. Комбин

Геометрическое определение вероятности
    Геометрическое определение вероятности прим

Аксиоматическое определение вероятности
Аксиоматическое построение теории вероятностей создано в начале 30-х годов академиком А. Н. Колмогоровым. Аксиомы теории вероят­ностей вводятся таким образом, чтобы вероятность события обладала осн

Свойства вероятностей
Приведем ряд свойств вероятности, являющихся следствием акси­ом Колмогорова. С1. Вероятность невозможного события равна нулю, т.е. Р(Æ) =0.

Конечное вероятностное пространство
Пусть производится некоторый опыт (эксперимент), который имеет конечное число возможных исходов w1, w2, w3,.., wn. В этом случае Ώ = {

Условные вероятности
Пусть А и В — два события, рассматриваемые в данном опыте. На­ступление одного события (скажем, А) может влиять на возможность наступления другого (В). Для характеристики зависимости одн

Независимость событий
Из определения условной вероятности (п. 1.14) следует, что Р(А×В) = Р(А)×Р(ВçА)=Р(В)-Р(АçВ), (1.22) т. е. вероятность произведения

Вероятность суммы событий
Как известно (п. 1.11), вероятность суммы двух несовместных событии определяется аксиомой A3: ({А + В) = Р(А) + Р(В), А×В = Æ Выведем формулу суммы вероятностей двух совместных с

Формула полной вероятности
Одним из следствий совместного применения теорем сложения умножения вероятностей являются формулы полнойвероятности и Байеса. Напомним, что события А1, А2, …

Формула Байеса (теорема гипотез)
Следствием формулы (1.30) является формула Байеса или теорема гипотез. Она позволяет переоценить вероятности гипотез Hi, принятых до опыта и называе

Формула Бернулли
Простейшая задача, относящаяся к схеме Бернулли, состоит в определении вероятности того, что в п независимых испытаниях собы­тие А наступит т раз (0 £т £ n

Понятие случайной величины. Закон распределения случайной величины
Одним из важнейших понятий теории вероятностей (наряду со слу­чайным событием и вероятностью) является понятие случайной вели­чины. Под случайной величиной понимают величину, которая в резул

Закон распределения дискретной случайной величины. Многоугольник распределения
Пусть X — д. с. в., которая принимает значения x1, x2, x3,…,xn,… (множество этих значений конечно или счетно) с некоторой вероят­ностью pi

Функция распределения и ее свойства. Функция распределения дискретной случайной величины
Очевидно, ряд распределения с.в. может быть построен только для д.с. в.: для н. с. в. нельзя даже перечислить все ее возможные значения. Кроме того, как увидим позже (п. 2.3, 2.4), вероятность кажд

Математическое ожидание случайной величины
Математическим ожиданием (или средним значением) д. с. в. X, — имеющей закон распределения рi = Р{Х = xi}, i= 1,2, 3,... , n, назы­вается число, равное сумме произвед

Дисперсия
Дисперсией (рассеянием) с. в. X называется математическое ожи­дание квадрата ее отклонения от своего математического ожидания. Обозначается дисперсия через DX (или

Среднее квадратическое отклонение
Дисперсия DX имеет размерность квадрата св. X, что в сравни­тельных целях неудобно. Когда желательно, чтобы оценка разброса (рассеяния) имела размерность с.в., используют еще одну числовую характер

Мода и медиана. Моменты случайных величин. Асимметрия и эксцесс. Квантили
Модой д. с. в. X называется ее значение, принимаемое с наибольшей вероятностью по сравнению с двумя соседними значениями, обознача­ется через M0X. Для н.с.b. M0X — точ

Предмет математической статистики
Математическая статистика — раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления

Генеральная и выборочная совокупности
Пусть требуется изучить данную совокупность объектов относи­тельно некоторого признака. Например, рассматривая работу диспет­чера (продавца, парикмахера,...), можно исследовать: его загружен

Графическое изображение статистического распределения
Статистическое распределение изображается графически (для на­глядности) в виде так называемых полигона и гистограммы. Полигон, как правило, служит для изображения дискретного (т. е. варианты от­лич

Числовые характеристики статистического распределения
Для выборки можно определить ряд числовых характеристик, ана­логичным тем, что в теории вероятностей определялись для случайных величин (см. п. 2.5). Пусть статистическое распределение выб

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги