рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Оценки параметров генеральной совокупности по ее выборке

Оценки параметров генеральной совокупности по ее выборке - раздел Математика, Лекция 4. СОБЫТИЕ И ВЕРОЯТНОСТЬ 1. Выборка Как Набор Случайных Величин.Пусть Имеется Некотор...

1. Выборка как набор случайных величин.Пусть имеется некоторая генеральная совокупность, каждый объект которой наделен количественным признаком X. При случайном извлечении объекта из генеральной совокупности становится известным значение х признака X этого объекта. Таким образом, мы можем рассматривать извлечение объекта из генеральной совокупности как испытание, X — как случайную величину, а х — как одно из возможных значений X.

Допустим, что из теоретических соображений удалось установить, к какому типу распределений относится признак X. Естественно, возникает задача оценки (приближенного нахождения) параметров, которыми определяется это распределение. Например, если известно, что изучаемый признак распределен в генеральной совокупности нормально, то необходимо оценить, т.е. приближенно найти математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.

Обычно в распоряжении исследователя имеются лишь данные выборки генеральной совокупности, например значения количественного признака x1, x2, …, xn полученные в результате п наблюдений (здесь и далее наблюдения предполагаются независимыми). Через эти данные и выражают оцениваемый параметр.

Опытные значения признака X можно рассматривать и как значения разных случайных величин Х1, Х2,..., Хn с тем же распределением, что и X, и, следовательно, с теми же числовыми характеристиками, которые имеет X. Значит, М(Хi) = М(Х) и D(Хi) = D(Х). Величины Х1, Х2,..., Хn можно считать независимыми в силу независимости наблюдений. Значения x1, x2, …, xn в этом случае называют реализациями случайных величин Х{, Хг,..., Х„. Отсюда и из предыдущего следует, что найти оценку неизвестного параметра — значит найти функцию от наблюдаемых случайных величин Х1, Х2,..., Хn, которая и дает приближенное значение оцениваемого параметра.

4. Генеральная и выборочная средние. Методы их расчета.Пусть изучается дискретная генеральная совокупность объема N относительно количественного признака X.

Определение 1. Генеральной средней (или а) называется среднее арифметическое значений признака генеральной совокупности.

Если все значения x1, x2, …, xN признака генеральной совокупности объема N различны, то

Если же значения признака x1, x2, …, xk имеют соответственно частоты N1, N2, …, Nk, причем N1+N2+…+ +Nk,=N то

или

(10.1)

Как уже отмечалось (см. п. 1), извлечение объекта из генеральной совокупности есть наблюдение случайной величины X.

Пусть все значения x1, x2, …, xN различны. Так как каждый объект может быть извлечен с одной и той же вероятностью, то

т.е.

М(Х) = . (10.2)

Такой же итог следует, если значения x1, x2, …, xk имеют соответственно частоты N1, N2, …, Nk.

В случае непрерывного распределения признака X по определению полагают = М(Х).

Пусть для изучения генеральной совокупности относительно количественного признака X произведена выборка объема n.

Определение 2. Выборочной средней называется среднее арифметическое значений признака у выборки из совокупности.

Если все значения x1, x2, …, xn признака выборки объема п различны, то

(10.3)

 

Если же значения признака x1, x2, …, xk имеют соответственно частоты n1, n2, …, nk, причем n1+ n2+…+nk=n, то

или

(10.4)

Пример 10.4.Выборочным путем были получены следующие данные о массе 20 морских свинок при рождении (г): 30, 30, 25, 32, 30, 25, 33, 32,29, 28, 27, 36, 31, 34, 30, 23, 28, 31, 36, 30. Найдем выборочную среднюю .

Решение. Согласно формуле (10.4)

Итак, = 30 г.

Здесь для облегчения вычислений можно использовать калькулятор. То же следует иметь в виду и в ряде других примеров этой лекции.

Ниже, не уменьшая общности рассуждений, будем считать значения x1, x2, …, xn признака различными.

Разумеется, выборочная средняя для различных выборок того же объема п из той же генеральной совокупности будет получаться, вообще говоря, различной. И это не удивительно — ведь извлечение i-го по счету объекта есть наблюдение случайной величины Xi, а их среднее арифметическое есть тоже случайная величина.

Таким образом, всевозможные могущие получиться выборочные средние есть возможные значения случайной величины , которая называется выборочной средней случайной величиной.

Найдем М(), пользуясь тем, что М(Хi) = М(Х) (см. п. 1).

С учетом свойств математического ожидания (см. предыдущую лекцию) получаем

Итак, М() (математическое ожидание выборочной средней) совпадает с а (генеральной средней).

Теперь найдем D(). Так как D(Хi)=D(Х) (п. 1) и X1, X2, …, Xn независимы, то согласно свойствам дисперсии (см. предыдущую лекцию) получаем

т. е.

(10.5)

Наконец, отметим, что если варианта хi — большие числа, то для облегчения вычисления выборочной средней применяют следующий прием. Пусть С — константа.

Так как

то формула (10.3) преобразуется к виду

(10.6)

Константу С (так называемый, ложный нуль) берут такой, чтобы, во-первых, разности хi-С были небольшими и, во-вторых, число С было по возможности «круглым».

Пример 10.5. Имеется выборка: х1=71,88; х2=71,93; х3=72,05; х4=72,07; х5=71,90; х6=72,02; х7=71,93; х8=71,77; х9=72,11; х10=71,96.

Найдем среднюю выборочную.

Решение. Берем С=72,00 и вычисляем разности ai=х i-С:

a1=-0,12; a2=-0,07; a3=0,05; a4=0,07; a5=-0,10; a6=0,02; a7=-0,07; a8=-0,23; a9=0,11; a10 =-0,04.

Их сумма

a1+a2 +.... +a10 = -0,38,

их среднее арифметическое

= -0,038 » -0,04.

Тогда, выборочная средняя

»72,00-0,04 = 71,96.

5. Генеральная и выборочная дисперсии. Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят следующую характеристику — генеральную дисперсию.

Определение 1. Генеральной дисперсией Dг. называют среднее арифметическое квадратов отклонений значений признака X генеральной совокупности от генеральной средней .

Если все значения x1, x2, …, xN признака генеральной совокупности объема N различны, то

Если же значения признака x1, x2, …, xk имеют соответственно частоты N1, N2, …, Nk, причем N1+N2,+…+ +Nk=N, то

(10.7)

Пример 10.6. Генеральная совокупность задана таблицей распределения:

хi
Ni

Найдем генеральную дисперсию.

Решение. Согласно формулам (10.1) и (10.7)

Генеральным средним квадратическим отклонением (стандартом) называется sг=

Пусть все значения x1, x2, …, xN различны.

Найдем дисперсию признака X, рассматриваемого как случайная величина:

D(Х)=М[((Х)(Х))2].

Так как М(Х)=и Р{Х= хi}=(см. п. 2), то

т. е. D(Х)=DГ.

Таким образом, дисперсия D(Х) равна DГ.

Такой же итог следует, если значения x1, x2, …, xk имеют соответственно частоты N1, N2, …, Nk.

В случае непрерывного распределения признака X по определению полагают

DГ =D(Х). (10.8)

С учетом формулы (10.8) формула (10.5) (п. 2) перепишется в виде

откуда или . Величину называют средней квадратической ошибкой.

Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения , вводят нижеследующую характеристику.

Определение 2. Выборочной дисперсиейDВназывается среднее арифметическое квадратов отклонений наблюдаемых значений признака Х от выборочной средней .

Если все значения x1, x2, …, xn признака выборки объема n различны, то

(10.9)

Если же значения признака x1, x2, …, xk имеют соответственно частоты n1, n2, …, nk, причем n1+n2+…+nk=n, то

(10.10)

Пример 10.7.Выборочная совокупность задана таблицей распределения:

хi
Ni

Найдем выборочную дисперсию.

Решение. Согласно формулам (10.4) и (10.10)

Выборочным средним квадратическим отклонением (стандартом) называют квадратный корень из выборочной дисперсии: sв=

В условиях примера 10.5 получаем, что sв===1. Ниже, не уменьшая общности рассуждений, будем считать значения x1, x2, …, xn признака различными.

Выборочную дисперсию, рассматриваемую нами как случайную величину, будем обозначать:

Справедлива (см. например, [2]) следующая теорема.

Теорема 10. 1. Математическое ожидание выборочной дисперсии равно , т. е. .

В заключение настоящего пункта отметим, что если варианты хi — большие числа, то для облегчения вычисления выборочной дисперсии Dв формулу (10.9) преобразуют к следующему виду:

где С — ложный нуль.

7.Оценки параметров распределения.Уже говорилось (см. п. 1) о том, что одной из задач статистики является оценка параметров распределения случайной величины X по данным выборки. При этом в теоретических рассуждениях считают, что генеральная совокупность бесконечна. Это делается для того, чтобы можно было переходить к пределу при n®¥, где n — объем выборки. Для оценки параметров распределения X из данных выборки составляют выражения, которые должны служить оценками неизвестных параметров. Например, (см. п. 2) является оценкой генеральной средней, (см. п. 3) — оценкой генеральной дисперсии . Обозначим через Q оцениваемый параметр, через — оценку этого параметра (является выражением, составленным из X1, X2, …, Xn (см. п. 1)). Для того чтобы оценка давала хорошее приближение, она должна удовлетворять определенным требованиям. Укажем эти требования.

Несмещенной называют оценку , математическое ожидание которой равно оцениваемому параметру , т.е. M()=, в противном случае оценка называется смещенной.

Пример 10.8.Оценка является несмещенной оценкой генеральной средней а, так как М(Х}=а (см. п. 2).

Пример 10.9. Оценка является смещенной оценкой генеральной дисперсии , так как согласно установленной выше теореме (см. п. 3) .

Пример 10.10. Наряду с выборочной дисперсией рассматривают еще так называемую исправленную дисперсию , которая является также оценкой генеральной дисперсии. Для S2 с учетом установленной выше теоремы (см. п. 3) имеем

Таким образом, оценка S2 в отличие от оценки является несмещенной оценкой генеральной дисперсии. Явное выражение для S2 имеет вид

т.е.

(10.11)

Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки, для того чтобы не делать систематической ошибки в сторону завышения или занижения.

Состоятельной называют такую оценку параметра Q, что для любого наперед заданного числа e> 0 вероятность Р{|-Q|<e} при n®¥ стремится к единице (в таком случае говорят, что сходится к Q по вероятности) . Это означает, что при достаточно больших п можно с вероятностью, близкой к 1, т.е. почти наверное, утверждать, что оценка отличается от оцениваемого параметра Q меньше чем на e.

Очевидно, такому требованию должна удовлетворять всякая оценка, пригодная для практического использования.

Заметим, что несмещенная оценка будет состоятельной, если при n®¥ ее дисперсия стремится к нулю: D() ®0.

Пример 10.11. Как было установлено ранее (см. п. 3), Отсюда следует, что несмещенная оценка является и состоятельной, так как

Можно показать, что несмещенная оценка S2 является также состоятельной. Поэтому в качестве оценки генеральной дисперсии принимают исправленную дисперсию. Заметим, что оценки S2 и отличаются множителем , который стремится к 1 при n®¥. На практике S2 и не различают при n>30.

Для оценки генерального среднего квадратического отклонения используют исправленное среднее квадратическое отклонение, которое равно квадратному корню из исправленной дисперсии:

(10.12)

Левые части формул (10.11), (10.12), в которых случайные величины X1, X2, …, Xn заменены их реализацией x1, x2, …, xn и — выборочной средней , будем обозначать соответственно через s2 и s.

Отметим, что если варианты хi — большие числа, то для облегчения вычисления s2 формулу для s2 аналогично формуле (10.9) преобразуют к виду

 

(10.13)

где С — ложный нуль.

Оценки, обладающие свойствами несмещенности и состоятельности, при ограниченном числе опытов могут отличаться дисперсиями.

Ясно, что чем меньше дисперсия оценки, тем меньше вероятность грубой ошибки при определении приближенного значения параметра. Поэтому необходимо, чтобы дисперсия оценки была минимальной. Оценку, обладающую таким свойством, называют эффективной.

Из отмеченных требований, предъявляемых к оценке, наиболее важными являются требования несмещенности и состоятельности.

Пример 10.12. С плодового дерева случайным образом отобрано 10 плодов. Их массы x1, x2, …, x10 (в граммах) записаны в первой колонке приведенной ниже таблицы. Обработаем статистические данные выборки. Для вычисления и s по формулам (10.6) и (10.13) введем ложный нуль С =250 и все необходимые при этом вычисления сведем в таблицу.

i хi хi (хi)2
-25
-30
-5
-39
-16
-20
-19
Сумма -72

Следовательно ,

Отсюда

Итак, оценка генеральной средней массы плода равна 243 г со средней квадратической ошибкой 9 г.

Оценка генерального среднего квадратического отклонения массы пло­да равна 28 г.

 

– Конец работы –

Эта тема принадлежит разделу:

Лекция 4. СОБЫТИЕ И ВЕРОЯТНОСТЬ

Теорема сложения вероятностей несовместимых событий Пример Испытание... Вопросы для контроля знаний и подведения итога прочитанной... Дайте определение случайной величины...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Оценки параметров генеральной совокупности по ее выборке

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Лекция 4. СОБЫТИЕ И ВЕРОЯТНОСТЬ
Цель: Изучить основные понятия теории вероятности План: 1.Основные понятия. Определение вероятности 2. Свойства вероятности 3. Вопросы для контроля знаний и подв

Теорема сложения вероятностей несовместимых событий.
Определение 1. Суммой событий А и В называют событие С = А + В, состоящее в наступлении, по крайней мере, одного из событий А или

Формула полной вероятности.
Теорема 8.5. Вероятность события А, которое может наступить лишь при условии появления одного из п попарно несовместимых событий В1, В2,... , В

Формула Бейеса.
Пусть в условиях рассуждения, относящегося к формуле полной вероятности, произведено одно испытание, в результате которого произошло событие А. Спрашивается, как изменились (в связи с тем, ч

Вопросы для контроля знаний и подведения итога прочитанной лекции
  1. Дайте определения противоположным, независимым, несовместным событиям. Приведите примеры таких событий. 2. Что называется полной группой событий? 3. Сформулируй

Случайные величины
1. Понятие «случайные величины». Определение 1. Случайной величиной называют переменную величину, которая в зависимости от исхода испытания случайн

Математическое ожидание дискретной случайной величины
1. Понятие математического ожидания.Закон распределения полностью задает дискретную случайную величину. Однако часто встречаются случаи, когда закон распределения случайной величин

Свойства математического ожидания дискретной случайной величины.
1.Математическое ожидание постоянной величины С равно этой величине. Постоянную С можно рассматривать как дискретную случайную величину, принимающую лишь одно зн

Дисперсия дискретной случайной величины
1. Понятие дисперсии.Математическое ожидание не дает полной характеристики закона распределения случайной величины. Покажем это на примере. Пусть заданы две дискретные случайные ве

Среднее квадратическое отклонение.
Определение. Средним квадратическим отклонением s(X) случайной величины X называется корень квадратный из ее дисперсии: s(X) =

Понятие о моментах распределения.
Определение 1. Начальным моментом порядка k случайной величины X называют математическое ожидание случайной величины Xk, где k — натуральное

Непрерывные случайные величины
1. Интегральная функция распределения. Для непрерывной случайной величины в отличие от дискретной нельзя построить таблицу распределения. Поэтому непрерывные случайные величины изучают другим спосо

Математическое ожидание и дисперсия непрерывной случайной величины.
Определение 1. Математическим ожиданием непрерывной случайной величины Х с плотностью вероятности f(x) называют величину несобственного интеграла (если он сход

Некоторые законы распределения случайных величин
1. Биномиальное распределение.Пусть производится п испытаний, причем вероятность появления события А в каждом испытании равна р и не зависит от исхода других и

Локальная и интегральная предельные теоремы Лапласа.
Если число испытаний п велико, то вычисления по формуле Бернулли становятся затруднительными. Лаплас получил важную приближенную формулу для вероятности Рn(т) появления соб

Гипергеометрическое распределение
Гипергеометрическое распределение имеет место при выборочном контроле конечной совокупности объектов объёма N по альтернативному признаку. Каждый контролируемый объект классифицируетс

Генеральная совокупность и выборка
Мы приступаем к изучению элементов математической статистики, в которой разрабатываются научно обоснованные методы сбора статистических данных и их обработки. 1. Генеральная совоку

Лекция 7. ЭЛЕМЕНТЫ ТЕОРИИ ГРАФОВ. ОСНОВНЫЕ ПОНЯТИЯ
Цель: Изучить основные понятия теории графов План: 1. Основные понятия и определения графа и его элементов 2. Деревья. Лес. Бинарные деревья 3. Способы задания г

Деревья. Лес. Бинарные деревья
С вершины дорога вперед — только вниз. Я. Таранов Деревомназывают конечный связный граф с выделенной вершиной (корнем),не имеющий циклов (

Сети. Сетевые модели представления информации
В этом проглядывается талант исследователя охватить значительные районы явлений с помощью немногочисленных допущений, представить разносторонние совокупности предметов и процессов в сжатой, компакт

Применение графов и сетей
Храни порядок, и порядок сохранит тебя. Латинская формула Сети получили широкое практическое применение потому, что они являются естественным и удобным способом изображения

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги