рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Статистическое распределение выборки. Гистограмма. Эмпирическая функция распределения

Статистическое распределение выборки. Гистограмма. Эмпирическая функция распределения - раздел Образование, Часть 2. Математическая Статистика Тема 1....

Часть 2. Математическая статистика

Тема 1. Основные понятия математической статистики

1. Генеральная совокупность. Выборка. Выборочные значения как случайные величины.

2. Статистическое распределение выборки. Гистограмма. Эмпирическая функция распределения.

3. Числовые характеристики выборочных распределений.

1.

При исследовании реальных экономических процессов приходится обрабатывать большие объемы статистических данных по самым разнообразным показателям, которые по своей сути являются случайными величинами.

Пусть изучается совокупность однородных объектов относительно некоторого количественного признака, характеризующего эти объекты. Например, доход населения, количество покупателей в течение дня, количество качественных товаров в исследуемой партии и т.д.

Введем основные понятия, связанные с выборками.

Генеральной совокупностью называется совокупность объектов, из которых производится выборка или, другими словами, множество возможных значений случайной величины Х.

Выборочной совокупностью (или выборкой) называется совокупность случайно отобранных объектов из генеральной совокупности.

Число объектов в совокупности называется ее объемом.

Информация о генеральной совокупности, полученная на основании выборочного наблюдения, обычно обладает некоторой погрешностью, так как она… 1) Как организовать выборочное наблюдение, чтобы полученная информация… 2) Как использовать результаты выборки для суждения по ним с наибольшей надежностью о свойствах и параметрах…

2.

Установление статистических закономерностей, присущих массовым случайным явлениям, основано на изучении статистических данных – сведений о том, какие значения принял в результате наблюдений интересующий нас признак (случайная величина Х).

Различные значения признака (случайной величины Х) называются вариантами (обозначим их через х).

Рассмотрение и осмысление этих данных (особенно при большом числе наблюдений n) затруднительно, и по ним практически нельзя представить характер распределения признака (случайной величины Х).

Первый шаг к осмыслению имеющегося статистического материала – это его упорядочение. Расположение вариантов в порядке возрастания (убывания), т.е. ранжирование вариантов ряда.

Пример 1.

В таблице приведена выборка результатов измерения роста 105 студентов (юношей). Измерения проводились с точностью до 1см.

         

xmin=152, 155,…, 196=xmax

В таком виде изучать рост студентов тоже неудобно из-за большого числа данных. В этом случае варианты разбивают на отдельные интервалы, т.е. проводят их группировку.

Число интервалов m следует брать не очень большим, чтобы после группировки ряд не был очень громоздким, и не очень малым, чтобы не потерять особенности распределения признака. На практике обычно считают, что правильно составленный ряд распределения содержит от 6 до 15 частичных интервалов, однако фактическое число таких интервалов определяется условием задачи.

Согласно формуле Стерджеса рекомендуемое число интервалов m=1+3,322∙lg n, а величина интервала (интервальная разность, ширина интервала) , где хmax-xmin – разность между наибольшим и наименьшим значениями признака.

В нашем примере Примем k=6. За начало первого интервала рекомендуется брать величину или хmin.

Числа, показывающие, сколько раз встречаются варианты из данного интервала, называются частотами (обозначаются ni), а отношение их к общему числу наблюдений – частостями или относительными частотами, т.е. . Частоты и частости называются весами.

При изучении вариационных рядов наряду с понятием частоты, используется понятие накопленной частоты (). Она показывает, сколько наблюдалось вариантов со значением признака, меньшим х. Отношение накопленной частоты к общему числу наблюдений назовем накопленной частостью . Накопленные частоты (частости) для каждого интервала находятся последовательным суммированием

Определение. Вариационным рядом называется ранжированный в порядке возрастания (или убывания) ряд вариантов с соответствующими им весами (частотами или частостями).

Пример 1. Сгруппированный ряд примера 1 представим в виде таблицы

i x ni wi niнак wiнак
152-158 0,0381 0,0381
158-164 0,0191 0,0572
164-170 0,1809 0,2381
179-176 0,1809 0,4190
176-182 0,3048 0,7238
182-188 0,2095 0,9333
188-194 0,0476 0.9809
194-200 0,0191
  Σ    

Для задания вариационного ряда достаточно указать варианты и соответствующие им частоты (частости) или накопленные частоты (частости).

Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину, и непрерывным (интервальным), если варианты могут отличаться один от другого на сколь угодно малую величину.

Ряд, представленный в примере 1 является интервальным.

Пример дискретного вариационного ряда является число покупателей в следующей задаче.

Пример 2. В супермаркете проводились наблюдения над числом Х покупателей, обратившихся в кассу за один час. Наблюдения в течение 30 часов дали следующие результаты:

70, 75,100, 120, 75, 60, 100, 120, 70, 60, 65, 100, 65, 100, 70, 75, 60, 100, 100, 120, 70, 75, 70, 120, 65, 70, 75, 70, 100, 100

Сгруппируем представленный ряд.

№ гр
Число покупателей
ni
wi 3/30 3/30 7/30 5/30 8/30 4/30
wiнак 0,1 0,2 0,43 0,6 0,87

Перечень вариант и соответствующих им частот называется статистическим распределением выборки. Здесь имеется аналогия с законом распределения случайной величины: в теории вероятностей – это соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике – это соответствие между наблюдаемыми вариантами и их частотами или частостями. Нетрудно видеть, что сумма относительных частот равна 1, т.е.∑ Wi=1

Весьма важным является понятие эмпирической функции распределения.

Определение. Эмпирическойфункцией распределения Fn(x) называется относительная частота (частость) того, что признак (случайная вличина X) примет значение, меньшее заданного х, т.е.

Эмпирическая функция распределения обладает теми же свойствами, что и функция распределения случайной величины в теории вероятностей:

1) Значения Fn(x) принадлежат отрезку [0; 1];

2) Fn(x) является неубывающей функцией;

3) Fn(x)=0 при x ≤ xmin, Fn(x)=1 при x ≥ xmax.

Наиболее часто вариационный ряды задаются с помощью графического изображения.

Полигон, как правило, служит для изображения дискретного вариационного ряда и представляет собой ломаную, в которой концы отрезков прямой имеют координаты (xi, ni),i=1,2,…m.

Гистограмма служит только для изображения интервальных вариационных рядов и представляет собой ступенчатую фигуру из прямоугольников с основаниями, равными интервалам значений признака , i=1,2,…m, и высотами, равными частотам (частостям) ni(wi) интервалов. Если соединить середины верхних оснований прямоугольников отрезками прямой, то можно получить полигон того же распределения.

Помимо полигона и гистограммы рассматривают еще один способ графического задания вариант – кумулятивная кривая – кривая накопленных частот (частостей). Для дискретного ряда кумулята представляет ломаную, соединяющую точки или . Для интервального вариационного ряда ломаная начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте (частости), равной нулю. Другие точки этой ломаной соответствуют концам интервалов.

Пример. Построить полигон (гистограмму), кумуляту и эмпирическую функцию распределения роста студентов и числа покупателей.

 

Пример 1.

 
 

 

 


Пример 2.

 
 

 


Вариационный ряд содержит достаточно полную информацию об изменчивости признака. Однако обилие числовых данных, с помощью которых он задается, усложняет их использование. В то же время на практике часто оказывается достаточным знание лишь сводных характеристик вариационных рядов. Расчет статистических характеристик представляет собой второй этап обработки данных наблюдений.

 

3.

Одной из основных числовых характеристик ряда распределения (вариационного ряда) является средняя арифметическая.

Существует две формулы расчета средней арифметической: простая и взвешенная.

Простую среднюю арифметическую обычно используют, когда данные наблюдения не сведены в вариационный ряд либо все частоты равны единице или одинаковы , где xi– i-е значение признака ; n – объем ряда.

Если частоты отличны друг от друга, расчет производится по формуле средней арифметической взвешенной , где i-е значение признака для дискретного ряда или середины интервалов интервального вариационного ряда; mi – частота i-го значения признака; k – число вариантов.

При расчете средней арифметической в качестве весов могут выступать и частости, тогда формула расчета средней арифметической взвешенной примет следующий вид: , где xi– i-е значение признака; k – число его значений (вариантов).

Найдем среднюю арифметическую по данным табл. примеров 1 и 2.

Решение.

, где 155, 161,…,197 – середины соответствующих интервалов.

Кроме рассмотренных средних величин, называемых аналитическими, в статистическом анализе применяются структурные, или порядковые средние. Из них наиболее широко применяются медиана и мода.

Определение. Медианой Ме вариационного ряда называется значение признака, приходящееся на середину ранжированного ряда наблюдений.

Для дискретного вариационного ряда с нечетным числом членов медиана равна серединному варианту, а для ряда с четным числом членов – полусумме двух серединных вариантов.

Для интервального вариационного ряда находится середина ряда, а значение медианы на этом интервале находят с помощью линейного интерполирования. Отметим, что медиана может быть приближенно найдена с помощью кумуляты или графика функции распределения как значение признака, для которого =n/2 или =1/2.

Пример.

1) Найдем медиану числа покупателей по данным таблицы примера 2

Решение. n=30 – четное, следовательно, серединных вариантов два: x15=75 и x16=75. Поэтому

Б) Найдем медиану роста студентов (табл.1)

Решение. На рисунке функции распределения и кумуляты проведем горизонтальную прямую у=0,5 (или у=50), соответствующую накопленной частости до пересечения с графиком эмпирической функции распределения (или кумулятой). Абсцисса точки пересечения и будет медианой вариационногоряда:Ме=178

Определение. Модой Мо вариационного ряда называется вариант, которому соответствует наибольшая частота.

Для дискретного вариационного ряда мода равна значению варианты, соответствуюшей наибольшей частоте.

Для интервального ряда находится модальный интервал, имеющий наибольшую частоту, а значение моды на этом интервале определяют с помощью линейного интерполирования. Однако проще моду можно найти графическим путем с помощью гистограммы.

На гистограмме распределения находим прямоугольник с наибольшей частотой (частостью). Соединяя отрезками прямых вершины этого прямоугольника с соответствующими вершинами двух соседних прямоугольников получим точку пересечения этих отрезков (диагоналей), абсцисса которой и будет модой вариационного ряда.

Пример.Найти моды для вариантов примеров 1 и 2.

1) для вариационного ряда примера 2 мода равна 100, так как этому варианту соответствует наибольшая частота равная 8.

2) На гистограмме распределения находим прямоугольник с наибольшей частотой (частостью). Соединяя отрезками прямых вершины этого прямоугольника с соответствующими вершинами двух соседних прямоугольников получим точку пересечения этих отрезков (диагоналей), абсцисса которой и будет модой вариационного ряда: Мо=178.

Колеблемость изучаемого признака можно охарактеризовать с помощью различных показателей вариации. К числу основных показателей вариации относятся: дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Дисперсию можно рассчитать по простой и взвешенной формулам, имеющим вид

Среднее квадратическое отклонение рассчитывается по формуле .

Коэффициент вариации определяется формулой

Пример. Рассчитаем показатели вариации для примеров 1 и 2.

Тема 2. Точечное оценивание

1. Параметрические статистические модели. Точечные оценки. Несмещенность оценки. Состоятельность оценки. Эффективность оценок. 2. Оценка математического ожидания. Несмещенная оценка дисперсии.  

Тема 3. Интервальное оценивание

2. Доверительные интервалы для математического ожидания. Оценивание дисперсии в статистике интервальных данных.   1.

Проверка статистических гипотез.

Гипотеза называется параметрической, если в ней содержится некоторое утверждение о значении параметра распределения известного вида. В непараметрической гипотезе заключается утверждение обо всем распределении. … Параметрическая гипотеза называется простой, если в ней речь идет ровно об одном значении параметра. В других случаях…

Проверка гипотез о числовых значениях параметров.

Соответствующие критерии проверки гипотез о числовых значениях параметров нормального закона приведем в таблице.   Замечание. Критические значения статистик на уровне значимости α определяют по соответствующим таблицам исходя из…

Проверка гипотез для двух независимых выборок

Тема 4. Проверка статистических гипотез

Гипотеза называется параметрической, если в ней содержится некоторое утверждение о значении параметра распределения известного вида. В непараметрической гипотезе заключается утверждение обо всем распределении. … Параметрическая гипотеза называется простой, если в ней речь идет ровно об одном значении параметра. В других случаях…

Проверка гипотез о числовых значениях параметров.

Соответствующие критерии проверки гипотез о числовых значениях параметров нормального закона приведем в таблице.   Замечание. Критические значения статистик на уровне значимости α определяют по соответствующим таблицам исходя из…

Проверка гипотез для двух независимых выборок

– Конец работы –

Используемые теги: Статистическое, распределение, выборки, Гистограмма, Эмпирическая, функция, распределения0.103

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Статистическое распределение выборки. Гистограмма. Эмпирическая функция распределения

Что будем делать с полученным материалом:

Если этот материал оказался полезным для Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Еще рефераты, курсовые, дипломные работы на эту тему:

Предмет и метод статистики. Правовая статистика как часть статистической науки. Статистическое наблюдение его задачи. Формы, виды и способы статистического наблюдения
Негосударственное образовательное учреждение высшего профессионального образования... Санкт Петербургский институт внешнеэкономических связей экономики и права...

Образовательная функция. Воспитательная функция. Развивающая функция
Обучение одна из основных категорий дидактики и компонент педагогического процесса... Обучение это целенаправленный и организованный процесс взаимодействия... Функции обучения образовательная воспитательная развивающая...

Функции распределения, плотность распределения
функции распределения плотность распределения... Мат ожидание дисперсия... Практика...

Раздел 7. Элементы математической статистики. Статистическое распределение выборки
Вопросы для обсуждения... Случайная величина значение случайной величины вариационный ряд... Первичная обработка опытных данных при изучении случайной величины...

Дискретная случайная величина: определение, закон распределения и функции распределения
Ситуация когда полную группу составляют равновозможные события называется классической Поэтому определение вероятности по формуле р А m n... Частотой р А появления события А или статистической вероятностью события А...

КУРСОВАЯ РАБОТА на тему Статистическая обработка выборки. Статистический анализ работы, использования подвижного состава на железнодорожном транспорте
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ... МИИТ... Институт экономики и финансов...

Раздел 7. Элементы математической статистики. Статистическое распределение выборки
Вопросы для обсуждения... Случайная величина значение случайной величины вариационный ряд... Первичная обработка опытных данных при изучении случайной величины...

Элементы статистической термодинамики. Равновесие закрытой системы в изохорно-изотермических условиях. Макро и микросостояния. Канонический ансамбль. Энтропия и вероятность. Распределение Больцмана. Статистические суммы
Для начала неплохо ещё было бы, чтобы они могли каким-то способом перемешиваться. Если система пребывает в равновесии, то и перемешивание её… Он не может выделить тех различий, которые неизбежны при перемешивании, и ему… Конечно же, квантовое фазовое пространство жто дискретное абстрактное математическое множество. Удивительно, что…

Понятие генеральной совокупности и выборки. Эмпирические аналоги параметров генеральной совокупности
Генеральной совокупностью называют исходное множетсво объектов из которого... Выборка выборочная совокупность совокупность случайно отобранных из генеральной совокупности объектов Выборка должна быть репрезентативной то...

Непрерывность функции. Точки разрыва. Асимптоты графика функции
Правила дифференцирования... Таблица производных основных функций...

0.034
Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • По категориям
  • По работам