Найдите соответствующие данные в сети Интернет

  1. Проанализируйте данные о числе шайб, забитых в каждой игре чемпионата России по хоккею, прошедшему в 201__ году. Сколько в среднем шайб было забито в каждой игре?
  2. Выберите любой вид спорта, входящий в программу олимпиады в _________. Проанализируйте данные о его результатах.
  3. Какова экологическая ситуация в том районе, в котором я проживаю за последние 3 года (например, анализ содержания в воздухе оксида углерода по месяцам)?
  4. Проанализировав данные о результатах в марафонском беге за последние 3 года, сделайте вывод о том, на какой возраст приходится расцвет спортивной карьеры бегуна-марафонца. Источник данных – http://www.alltime-athletics.com.
  5. Проанализируйте данные о крупнейших авиакатастрофах ХХ века. Каково среднее число жертв в катастрофах за последний год? Источник данных – http://www.airdisasters.co.uk. Как Вы считаете, можно ли определить по этим данным наиболее опасные для полетов время года, месяц, день недели, тип самолета?
  6. Проанализируйте последние статистические данные о самых населенных городах России. Составьте интервальный вариационный ряд с шагом d =100 тыс. человек для числа городов России с численностью более 500 тыс. человек (не включая Москву и Санкт-Петербург). Источник данных – http://rating.rbc.ru.

IV.Анализ статистических данных по теме, выбранной Вами самостоятельно. Тема обязательно должна быть согласована с преподавателем.

Методические указания по выполнению работы:

Математическая статистика - раздел математики, изучающий методы сбора, систематизации и обработки статистических данных для получения научных и практических выводов.

Основными понятиями математической статистики являются генеральная совокупность – совокупности всех изучаемых объектов, и выборка – часть объектов генеральной совокупности. Выборка должна быть репрезентативной – достаточно полно отражать изучаемые признаки генеральной совокупности.

Статистическое исследование состоит из нескольких этапов:

1. Определение цели и методов исследования (опрос, наблюдение).

2. Сбор статистических данных (обязательное условие – данные должны выражаться числом).

3. Представление статистических данных в виде дискретного (если все значения целесообразно перечислить) или интервального вариационного ряда (если значения целесообразно разделить на интервалы одинаковой ширины d).

Дискретныйвариационный ряд:

xi х1 х2 х3 хk
mi т1 т2 т3 тk п –объем выборки

Интервальныйвариационный ряд:

xi [хm; хm+d) [хm+d; хm+2d)
mi т1 т2 п –объем выборки

где xi - варианты (те данные, которые были получены), xm – наименьшее значение изучаемого признака;

mi – частоты (показывают, сколько раз встретилась каждая варианта);

Для интервального вариационного ряда d подбирается самостоятельно таким образом, чтобы таблица содержала не более 7-8 столбцов. В нижней строке записывают сумму частот вариант, попавших в каждый интервал.

4. Помимо вариационного, составляют статистический ряд - таблицу, первая строка которой содержит в порядке возрастания элементы xi, а вторая – их относительные частоты fi .

Относительная частота fi - отношение частоты к объему выборки, т.е. .

Дискретныйстатистический ряд:

xi х1 х2 х3 хk
fi f1 f2 f3 fk

Интервальныйстатистический ряд:

xi [хm; хm+d) [хm+d; хm+2d)
fi f1 f2

Относительная частота - аналог вероятности появления той или иной варианты. Очевидно, что

5. Геометрическая интерпретация статистических данных:

· для дискретного вариационного ряда - полигон частот (ломаная с вершинами в точках (xi, mi));

· для интервального вариационного ряда - гистограмма частот (ступенчатая фигура, состоящая из прямоугольников, построенных на интервалах длиной d, высота которых равна отношению mi/d (плотность частоты на данном интервале)).

6. Нахождение числовых характеристик выборки:

Числовые характеристики Формула
Выборочное среднее  
Выборочная дисперсия , где
Выборочное среднеквадратическое отклонение  

Для интервального вариационного ряда в качестве xi выбирают середину соответствующего интервала.

7. Вывод по проведённой работе (достижение целей исследования).

8. Оформление результатов в виде презентации (см. рекомендации по созданию презентаций на стр. 9).

Пример 25.1. Данные о количестве баллов, полученных на вступительном экзамене по математике среди случайным образом выбранных десяти человек, были следующие:

4,5; 7,0; 9,0; 6,5; 9,0; 6,0; 7,0; 7,0; 8,0; 7,5.

Составьте дискретный и интервальный вариационные и статистические ряды оценок, найдите числовые характеристики выборки. Постройте полигон и гистограмму частот.

Решение. Выполним группировку статистических данных, т.е. расположим их в порядке возрастания: 4,5; 6,0; 6,5; 7,0; 7,0; 7,0; 7,5; 8,0; 9,0; 9,0.

Составим дискретный вариационный ряд:

xi 4,5 6,0 6,5 7,0 7,5 8,0 9,0
mi

Составим статистический ряд:

xi 4,5 6,0 6,5 7,0 7,5 8,0 9,0
fi 0,1 0,1 0,1 0,3 0,1 0,1 0,2

В нашем примере полигон частот выглядит следующим образом:

 

 

 

       

 

 

 

     
                 
                 
                 
                 
                 
                 

 

Составим интервальный вариационный ряд. Зададим ширину интервала d. Пусть она равна 2 баллам. Тогда в вариационном ряду вместо значений вариант будем писать диапазон значений вариант, начиная с наименьшего возможного количества баллов (4), заканчивая наибольшим (10): 4,0 – 6,0; 6,0 – 8,0; 8,0 – 10,0. Договоримся значение левой границы каждого интервала считать принадлежащим данному интервалу, а правой – нет (за исключением двух крайних значений 4,0 и 10,0– их всегда берем включительно). Для вариант, попавших в один интервал, соответствующие частоты складываются. Тогда интервальный вариационный ряд будет иметь вид:

xi (4,0 – 6,0) [6,0 – 8,0) [8,0 -10,0]
mi

Составим статистический ряд:

xi (4,0 – 6,0) [6,0 – 8,0) [8,0 -10,0]
fi 0,1 0,6 0,3

тi
1,5
0,5
х
Построим гистограмму частот. Она будет состоять из трех прямоугольников, построенных на интервалах длиной d = 2 с высотами mi/d:

высота гистограмма частот
h1 ½ = 0,5
h2 6/2 = 3
h3 3/2 = 1,5

Найдем числовые характеристики выборки:

Для дискретного вариационного ряда

= .

Это означает, что средний балл у 10 наудачу выбранных абитуриентов равен 7,15.

Тогда 52,775 – (7,15)2 = 1,6525.

балла.

Для интервального вариационного ряда в качестве xi берут середину интервалов.

= балла;

, 56,2 – (7,4)2 = 1,44,

балла.

Список литературы:

1. Спирина М.С. Теория вероятностей и математическая статистика: учебник для студ. учредж. СПО / М.С. Спирина, П.А. Спирин. - М: Изд. центр «Академия», 2012. – 352 с. – Глава 3, §3.1-3.3, с. 181-197.

2. Письменный, Д.Т. Конспект лекций по теории вероятностей, математической статистике и случайным процессам. / Д. Т. Письменный. - М.: Айрис пресс, 2010. – 288 с. - Глава 7, §7.1-7.5, с. 212-224.