рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Числовые характеристики двумерной СВ

Числовые характеристики двумерной СВ - раздел Математика, Теория вероятностей   Для Двумерной Св (Как И Для Одномерной) Можно Ввести Числовые...

 

Для двумерной СВ (как и для одномерной) можно ввести числовые характеристики.

(X;Y) Мы можем взять сначала числовые характеристики компонент этой СВ: М(Х), М(Y). Тогда (М(Х); М(Y)) определяет центр распределения двумерной СВ.

Можно найти D(X) и D(Y).

Но числовые характеристики компонент не характеризуют степень зависимости составляющих компонент.

Для характеристики зависимости составляющих компонент вводится понятие корреляционного момента (коэффициент корреляции)

 

Свойства корреляционного момента:

1) KXY = KYX

2) Если X, Y независимые СВ, то KXY = 0.

Доказательство:

X, Y независимые СВ, , - также независимые СВ

 

Замечание: если KXY = 0, то это не значит, что X и Y - независимые СВ, они могут быть и зависимыми. В этом случае говорят, что СВ X и Y некоррелированы.

3)

Доказательство:

Рассмотрим СВ , но тогда и математические ожидания (среднее значение этой СВ) также будет 0.

 

 

 

 

 


1)

 

 

2)

 

 


 

.

Но на практике чаще используется коэффициент линейной корреляции, который определяется, как:

 

Свойства коэффициента линейной корреляции вытекают из свойств корреляционного момента:

1) ;

2) ;

3) ;

4) Если X, Y независимые СВ, то ;

5) Если , то между СВ X и Y существует функциональная зависимость.

Доказательство:

 

 

 

 

 

 

Условные законы распределения составляющих компонент

 

у х x1 x2 xК РУ
y1 P11 P21 РК1 g1
y2 P12 P22 PK2 g2
yn P1n P2n PKn gn
PX 1 P2 PK  

 

Пусть У = уJ0 - фиксирована.

Х распределён при условии У = уJ0 .

 

Х x1 x2 xк
Р i     ...  

 

Условный закон распределения СВ Х, когда СВ У приняла фиксированное значение У = уJ0 .

,

 

В случае непрерывного распределения СВ вводятся условные плотности распределения составляющих компонент.

Х, У = у - const.

 

=

 

СВ Х называется независимой от СВ У, если закон распределения СВ Х не зависит от того, какое значение приняла СВ У.

Можно показать, что необходимым и достаточным условием независимости СВ Х от У является:

.

 

Закон больших чисел

 

СВ принимает значения, зависящие от многих причин, учесть которые не предоставляется возможным, и поэтому, невозможно заранее предвидеть, какое значение примет эта СВ в конкретном опыте. Можно поставить вопрос, обладает ли некоторой закономерностью сумма достаточно большого числа СВ. На первый взгляд можно предположить, что если заранее нельзя указать значения слагаемых суммы, то и нельзя предсказать значение и всей суммы. Но при некоторых условиях поведение суммы достаточно большого числа СВ утрачивает характер случайности, и становится закономерным. Совокупность этих условий, утверждений и теорем объединены в общий термин – Закон больших чисел – совокупность теорем, утверждающих с вероятностью сколь угодно близкой к 1, что наступит некоторое событие, зависящее от достаточно большого числа случайных событий, каждое из которых оказывает на это событие незначительное влияние. К числу таких теорем относят теоремы: Бернулли, Чебышева, центральную предельную теорему.

Для доказательства этих теорем используется неравенство Чебышева:

, где СВ Х имеет конечное математическое ожидание и

Иногда неравенство Чебышева записывается в виде:

.

Теорема Чебышева:

Если СВ Х1, Х2, …, Хn попарно независимы и их дисперсии ограничены одной и той же постоянной величиной, то:

 

 

( )

Пояснение: Почти достоверно, что модуль отклонения среднего арифметического СВ от среднего арифметического их математических ожиданий будет сколь угодно малым, если число этих величин достаточно велико.

Теорема Чебышева имеет важное практическое значение. Например, этой теоремой пользуются при измерении некоторой величины. В качестве ее значения принимают среднее арифметическое всех проведенных измерений.

Теорема Бернулли:

Если m – число появлений события А в n независимых испытаниях и р – вероятность появления события А в каждом испытании, то

 

 

 

Математическая статистика

 

Основные задачи математической статистики:

 

1. Организация и планирование статических наблюдений;

2. Сбор статических данных;

3. «Свёртка» информации (методы группировки и сокращения статических данных с целью сведения большого числа данных к небольшому числу параметров, которые в сжатом виде характеризуют всю исследуемую совокупность);

4. Анализ статических данных;

5. Принятие решений, рекомендаций и выводов на основе анализа статических данных;

6. Прогнозирование случайных явлений.

Одним из основных методов математической статистики (МС) является выборочный метод.

 

 

Генеральная и выборочная совокупности

 

Пусть требуется изучить некоторый признак (количественный или качественный), характеризующий совокупность однородных объектов. Чтобы сделать это, можно провести сплошное обследование, но при большом числе объектов осуществить это обследование не всегда удается либо такое обследование потеряет смысл (в случае, когда произойдет изменение этих объектов в результате обследования). Вследствие этого для изучения интересующего признака применяется выборочный метод. Сущность этого метода заключается в том, что обследованию подвергается не вся совокупность однородных объектов, а только некоторая их часть, выбранная из этой совокупности. Выводы, полученные при обследовании этой совокупности, распространяются на всю совокупность однородных объектов.

Введем понятия, связанные с выборочным методом.

Генеральной совокупностью называется совокупность всех однородных объектов, подлежащих обследованию.

Выборочной совокупностью называется совокупность объектов, выбранная случайным образом из генеральной совокупности и подвергающаяся обследованию.

N – объем генеральной совокупности;

n – объем выборочной совокупности (выборки).

Выборка бывает повторная ( с возвращением исследуемого объекта в генеральную совокупность) и бесповторная.

На практике чаще всего используется бесповторная выборка. Выборка должна быть репрезентативной (представительной). Это означает, что результаты исследования выборочной совокупности правильно дают информацию обо всей генеральной совокупности. Для того, чтобы выборка была репрезентативной, она должна проводиться случайным образом. При изучении признака изменение этого признака от объекта к объекту называется вариацией, а само значение этого признака – вариантой. ()

 

 

Статистическое распределение выборки

 

Статистический материал, полученный в результате наблюдений (измерений), представляет собой набор чисел, полученный в результате их получения. Первой задачей обработки этого материала является наведение порядка в полученном ряду. Если объем выборки не велик (n<25), то их можно расположить в порядке возрастания или убывания.

Например, число бракованных деталей в различных партиях.

 

X x1 x2 xk
mi m1 m2 mk

 

Статический дискретный ряд распределения (дискретный вариационный ряд)

 

mi – частота (вес); рi* = - относительная частота (частость).

Графически дискретный вариационный ряд изображается полигоном частот (относительных частот).

 

Простейшей характеристикой дискретного вариационного ряда является размах вариации:

.

В том случае, когда изучаемый признак непрерывен и объем выборки больше 25, применяется интервальный вариационный ряд. Полученный статистический материал группируется по интервалам. При этом размах вариации R разбивается на определенное число интервалов. Единого правила выбора числа интервалов не существует.

Например, , где n - объем выборки.

Значения, попавшие на конец интервала, относят либо к левому, либо к правому интервалу, а иногда одно – к левому, а другое – к правому. После разбивки на интервалы производится подсчет значений, попавших в каждый из интервалов.

 

Интервалы [Xmin; Xmin+h] (Xmin+h; Xmin+2h] . . .
Подсчет интервалов      
mi  
Pi*      
Накопленная относительная частота      

 

Интервальный вариационный ряд часто изображается графически в виде гистограммы частот (относительных частот).

 

Если верхнюю границу этой ступенчатой фигуры для гистограммы относительных частот заменить плавной кривой, уравнение которой то является аналогом функции плотности распределения вероятностей и будет называться функцией распределения плотности относительных частот.

 

 

Эмпирическая функция распределения

 

Эмпирической функцией распределения (функцией распределения выборки) называется функция, определяющая для каждого значения х относительную частоту события, что Хх.

*( )=

mx – количество вариант выборки, меньших х.

Из теоремы Бернулли (смотри закон больших чисел) следует, что при достаточно больших n F*(x) и F(x) мало отличаются друг от друга.

 

Числовые характеристики вариационных рядов

 

Ранее изучались числовые характеристики СВ. Аналогичные числовые характеристики вводятся и для распределений изучаемого признака, для генеральной и выборочной совокупностей.

Генеральной средней () называется среднее арифметическое значений признака генеральной совокупности.

 

( ).

 

Выборочной средней () называется среднее арифметическое значений признака выборочной совокупности.

 

( ).

Генеральной дисперсией называется среднее арифметическое квадратов отклонений значений изучаемого признака генеральной совокупности от их генеральной средней.

 

 

 

( ).

 

Выборочная дисперсия

 

 

( ).

 

 

, .

Замечание: Числовые характеристики построены для дискретного вариационного ряда, а если рассматривается интервальный вариационный ряд, то в качестве хi берутся середины интервалов, а именно .

 

 

Оценки параметров распределения по опытным данным

 

Цель исследования ­− изучить исследуемый признак генеральной совокупности. Если из теоретических исследований известен закон распределения признака генеральной совокупности, то по результатам исследования признака выборочной совокупности мы должны получить приближенные значения (точечные оценки) параметров этого закона распределения.

К точечным оценкам параметров распределения предъявляют особые требования: несмещенность, состоятельность и эффективность.

Пусть точечная оценка параметра , полученная по выборке.

− новая СВ, зависящая от выборки.

Требования к :

1) Оценка называется несмещенной оценкой параметра , если М( =

Если М( ≠ , то оценка называется смещенной.

2) Оценка называется состоятельной оценкой параметра α, если она по вероятности стремится к оцениваемому параметру, т.е. для всех ε>0,

3) Оценка называется эффективной, если для данного объема выборки n ее дисперсия минимальна: D ( )−min.

Не всегда удается построить оценку для параметра α, удовлетворяющую всем трем требованиям. Иногда полезно построить, например, состоятельную, эффективную, но слегка смещенную оценку.

Наиболее важными числовыми характеристиками изучаемых признаков являются математическое ожидание и дисперсия, которые либо сами являются параметрами закона распределения, либо через них выражаются параметры. Естественно предположить, что является точечной оценкой для , а D­в является точечной оценкой для .

Покажем, что оценка является несмещенной и состоятельной оценкой для . Не ограничивая общностей, можно предполагать, что все значения выборки х1,х­2,…., хn различны и можем их рассматривать как независимые одинаково распределенные СВ: Х1, Х2, …., Хn.

Эти СВ имеют одинаковые числовые характеристики.

М(Х1)=М(Х2)=…=М(Хn)=а= .

М( )=М( )= =

Таким образом, является несмещенной оценкой для .

D(Х1)=D(Х2)=…=D(Хn)= .

Найдем D( )=D( ) = .

Запишем неравенство Чебышева:

 

 

Откуда следует, состоятельность этой оценки. Получение эффективных оценок весьма сложно. Отметим результаты: если СВ Х имеет нормальное распределение с параметрами ( ), то несмещенная и состоятельная оценка для является и эффективной оценкой. Для других распределений это может и не выполняться.

Рассмотрим точечную оценку . Легко доказываются следующие формулы на основании свойств дисперсии:

=

:

 

Докажем важную формулу для дисперсии:

С – const.

 

 

.

 

Из этой формулы следует, что

Выберем с= , тогда

, .

 

 

М( )=М( )= ….

М( )=

M( )=

…. =

М( )=

 

Это указывает на то, что является смещенной оценкой для . Поэтому в качестве несмещенной оценки для исправленная выборочная дисперсия.

 

S2=

– поправка Бесселя.

При n→∞, , поэтому при больших объемах выборки

S2

Можно показать, что оценки и S2 являются состоятельными оценками для , но не являются эффективными. В том случае, когда известно , то используется несмещенная, состоятельная и эффективная оценка 2.

 

 

Распределения СВ применяемые в математической статистике

 

Гамма-функция и ее свойства

 

Гамма-функцией (интегралом Эйлера второго рода) называют интеграл вида:

.

 

Она зависит от параметра α.

1) Г(1)=Г(2)=1

Г(1)= .

Г(2)= .

2) Г(α+1)=α∙Г(α) α >0

Г(3)=2∙Г(2)=2∙1=2

3) Г(½)=

Для целых α из свойства (2) следует, что Г(α)=(α-1)!

Г(5/2)=Г(2,5)=Г(1+1,5)=1,5Г(1,5)=1,5Г(1+0,5)=1,5∙1∙Г(½)=1,5∙ .

 

 

Распределение (Хи-квадрат)

 

Рассмотрим СВ У, которая имеет нормальное распределение N(a,σ). Рассмотрим новую стандартизованную СВ :

, Эта СВ имеет нормальное распределение с параметрами 0 и 1, а СВ - говорят имеет распределение с одной степенью свободы.

Пусть имеется n независимых СВ У12,…,Уn, нормально распределенных с параметрами N(aii), i= , построим стандартизованные СВ.

Строим

 

Эта СВ имеет распределение с ν = n степенями свободы. В дальнейшем ν – число степеней свободы. Эта СВ имеет следующую функцию плотности распределения вероятности.

 

 

На практике как правило используется не плотность вероятности, а квантили -распределения - . Квантилем называется такое значение при котором вероятность того, что = α.

.

Геометрически значит:

 

 

 

Распределение Стьюдента

(t-распределение)

 

t-распределение имеет важное значение при статических вычислениях, связанных с нормальным законом распределения, когда значение σ² неизвестно и подлежит определению по опытным данным.

Пусть У, У1, У2, …, Уn- независимые, нормально распределенные СВ с параметрами аi=0, σi=1. Построим новую СВ

 

Эта СВ называется безразмерной дробью Стьюдента и имеет следующую функцию плотности распределения:

 

Для -∞< t <∞, - число степеней свободы.

М(t)=0, D(t)= , ( .

 

 

В приложениях приводятся значения квантилей распределения Стьюдента в зависимости от числа ν и заданного уровня значимости α.

 

 

Примечание: Нужно внимательно смотреть на таблицу. Квантили могут задаваться для двусторонней области, а могут для односторонней.

 

 

 

Распределение Фишера (Фишера-Снедекора)

F-распределение

 

Используется в математической статистике при сравнении дисперсий нормального распределения, вычисленных по опытным данным.

 

 

Эта СВ F распределена по закону Фишера и имеет следующую функцию плотности распределения:

 

 

– = m,

- = n.

Для этой функции так же рассматривается

.

 

 

Интервальное оценивание. Доверительный интервал и доверительная вероятность.

 

Точечное оценивание неизвестных параметров как правило используется в том случае, когда рассматриваются большие выборки(n велико). Если n мало, то точечная оценка малопоказательна. В этом случае используется так называемое интервальное оценивание, т.е. указывается такой интервал, который накрывает оцениваемый параметр с некоторой вероятностью.

Предположим, что оценивается параметр θ:

- его точечная оценка, тогда как правило используется симметричный интервал относительно оцениваемого параметра.

 

 

Можно сказать с вероятностью р, что истинное значение параметра находится внутри этого интервала. Сам интервал принято называть доверительным интервалом, а вероятность р – доверительной вероятностью(надежностью).

Наибольшее отклонение выборочного значения параметра от его истинного значения называется предельной ошибкой выборки. С вероятностью р можно утверждать, что истинное значение параметра принадлежит указанному интервалу, т.е.

P, как правило, задается заранее :

Р=0,95; 0,99; 0,9973; 0,99999.

Рассмотрим пример построения доверительного интервала.

 

– Конец работы –

Эта тема принадлежит разделу:

Теория вероятностей

Введение... Теория вероятностей ТВ возникла в XVII веке в связи с попыткой поставить на... Основные понятия...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Числовые характеристики двумерной СВ

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Необходимые сведения из комбинаторики
  Соединениями называются различные группы, составленные из каких-либо объектов. Элементами называются объекты, из которых состоят соединения. Различают 3 вида соеди

Алгебра событий
Определение: суммой (объединением) двух событий А и В называется событие, состоящее в том, что произойдет, по крайней мере, одно из этих событий. А + В = (А В)

Основные теоремы теории вероятности
Теорема 1: Вероятность суммы двух несовместных событий равна сумме их вероятностей. (Вероятность появления одного из двух несовместных событий, безразлично какого, равна с

Формула полной вероятности
  Пусть некоторое событие А может произойти при условии, что произойдет одно из несовместных событий Н1, Н2,…, Нn, образующих полную группу событий.

Случайные величины
Случайное событие является качественной характеристикой результата испытаний, но часто необходимо иметь количественную характеристику результата испытаний. Например, стрелок стреляет по ми

Функция распределения
  НСВ с помощью ряда распределения задать невозможно, поэтому введем в рассмотрение универсальный способ задания СВ. Определение: функцией распределен

Свойства дифференциальной функции распределения
  1. Дифференциальная функция распределения неотрицательна: f(x) 0, (т.к F(x) является неубывающей функцией, а производная всякой неубывающей функции неотрицательна).

Числовые характеристики случайной величины
  1) Введение 2) Математическое ожидание 3) Дисперсия   j Характеристиками СВ являются их функции распределения вероятностей или плот

Дискретные законы распределения
а) Биномиальное распределение – это распределение числа m появлений события А при n независимых испытаниях, при каждом из которых вероятность появления события А постоянна. Тогда справедлива

Непрерывные случайные величины
а) Равномерное распределение НСВ, которая принимает значения только на отрезке [a; b] с постоянной плотностью распределения, называется распределением по равномерному закону.

Двумерные СВ
  Примеры: Для упрощения в дальнейшем рассмотрим только двумерные СВ 1) (X;Y) – отклонение разрыва снаряда от цели по дальности и по фронту. 2) Случайное по

Построение доверительного интервала для математического ожидания нормально распределенной СВ при известном σ.
. Ранее было показано, что имеет нормальное распределение с параметрами М( )= , D( )= . Составим стандартизованную СВ:   u имеет нормальное распреде

Элементы корреляционного и регрессионного анализа
Модели и основные понятия корреляционного и регрессионного анализа   В математическом анализе зависимость между переменными Х и У задается определенной функцией: . И каждому

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги