IV.Анализ статистических данных по теме, выбранной Вами самостоятельно. Тема обязательно должна быть согласована с преподавателем.
Методические указания по выполнению работы:
Математическая статистика - раздел математики, изучающий методы сбора, систематизации и обработки статистических данных для получения научных и практических выводов.
Основными понятиями математической статистики являются генеральная совокупность – совокупности всех изучаемых объектов, и выборка – часть объектов генеральной совокупности. Выборка должна быть репрезентативной – достаточно полно отражать изучаемые признаки генеральной совокупности.
Статистическое исследование состоит из нескольких этапов:
1. Определение цели и методов исследования (опрос, наблюдение).
2. Сбор статистических данных (обязательное условие – данные должны выражаться числом).
3. Представление статистических данных в виде дискретного (если все значения целесообразно перечислить) или интервального вариационного ряда (если значения целесообразно разделить на интервалы одинаковой ширины d).
Дискретныйвариационный ряд:
xi | х1 | х2 | х3 | … | хk | ∑ |
mi | т1 | т2 | т3 | … | тk | п –объем выборки |
Интервальныйвариационный ряд:
xi | [хm; хm+d) | [хm+d; хm+2d) | … | ∑ |
mi | т1 | т2 | … | п –объем выборки |
где xi - варианты (те данные, которые были получены), xm – наименьшее значение изучаемого признака;
mi – частоты (показывают, сколько раз встретилась каждая варианта);
Для интервального вариационного ряда d подбирается самостоятельно таким образом, чтобы таблица содержала не более 7-8 столбцов. В нижней строке записывают сумму частот вариант, попавших в каждый интервал.
4. Помимо вариационного, составляют статистический ряд - таблицу, первая строка которой содержит в порядке возрастания элементы xi, а вторая – их относительные частоты fi .
Относительная частота fi - отношение частоты к объему выборки, т.е. .
Дискретныйстатистический ряд:
xi | х1 | х2 | х3 | … | хk | ∑ |
fi | f1 | f2 | f3 | … | fk |
Интервальныйстатистический ряд:
xi | [хm; хm+d) | [хm+d; хm+2d) | … | ∑ |
fi | f1 | f2 | … |
Относительная частота - аналог вероятности появления той или иной варианты. Очевидно, что
5. Геометрическая интерпретация статистических данных:
· для дискретного вариационного ряда - полигон частот (ломаная с вершинами в точках (xi, mi));
· для интервального вариационного ряда - гистограмма частот (ступенчатая фигура, состоящая из прямоугольников, построенных на интервалах длиной d, высота которых равна отношению mi/d (плотность частоты на данном интервале)).
6. Нахождение числовых характеристик выборки:
№ | Числовые характеристики | Формула |
Выборочное среднее | ||
Выборочная дисперсия | , где | |
Выборочное среднеквадратическое отклонение |
Для интервального вариационного ряда в качестве xi выбирают середину соответствующего интервала.
7. Вывод по проведённой работе (достижение целей исследования).
8. Оформление результатов в виде презентации (см. рекомендации по созданию презентаций на стр. 9).
Пример 25.1. Данные о количестве баллов, полученных на вступительном экзамене по математике среди случайным образом выбранных десяти человек, были следующие:
4,5; 7,0; 9,0; 6,5; 9,0; 6,0; 7,0; 7,0; 8,0; 7,5.
Составьте дискретный и интервальный вариационные и статистические ряды оценок, найдите числовые характеристики выборки. Постройте полигон и гистограмму частот.
Решение. Выполним группировку статистических данных, т.е. расположим их в порядке возрастания: 4,5; 6,0; 6,5; 7,0; 7,0; 7,0; 7,5; 8,0; 9,0; 9,0.
Составим дискретный вариационный ряд:
xi | 4,5 | 6,0 | 6,5 | 7,0 | 7,5 | 8,0 | 9,0 | ∑ |
mi |
Составим статистический ряд:
xi | 4,5 | 6,0 | 6,5 | 7,0 | 7,5 | 8,0 | 9,0 | ∑ |
fi | 0,1 | 0,1 | 0,1 | 0,3 | 0,1 | 0,1 | 0,2 |
В нашем примере полигон частот выглядит следующим образом:
|
| |||||||||
Составим интервальный вариационный ряд. Зададим ширину интервала d. Пусть она равна 2 баллам. Тогда в вариационном ряду вместо значений вариант будем писать диапазон значений вариант, начиная с наименьшего возможного количества баллов (4), заканчивая наибольшим (10): 4,0 – 6,0; 6,0 – 8,0; 8,0 – 10,0. Договоримся значение левой границы каждого интервала считать принадлежащим данному интервалу, а правой – нет (за исключением двух крайних значений 4,0 и 10,0– их всегда берем включительно). Для вариант, попавших в один интервал, соответствующие частоты складываются. Тогда интервальный вариационный ряд будет иметь вид:
xi | (4,0 – 6,0) | [6,0 – 8,0) | [8,0 -10,0] | ∑ |
mi |
Составим статистический ряд:
xi | (4,0 – 6,0) | [6,0 – 8,0) | [8,0 -10,0] | ∑ |
fi | 0,1 | 0,6 | 0,3 |
тi |
1,5 |
0,5 |
х |
высота | гистограмма частот |
h1 | ½ = 0,5 |
h2 | 6/2 = 3 |
h3 | 3/2 = 1,5 |
Найдем числовые характеристики выборки:
Для дискретного вариационного ряда
= .
Это означает, что средний балл у 10 наудачу выбранных абитуриентов равен 7,15.
Тогда 52,775 – (7,15)2 = 1,6525.
балла.
Для интервального вариационного ряда в качестве xi берут середину интервалов.
= балла;
, 56,2 – (7,4)2 = 1,44,
балла.
Список литературы:
1. Спирина М.С. Теория вероятностей и математическая статистика: учебник для студ. учредж. СПО / М.С. Спирина, П.А. Спирин. - М: Изд. центр «Академия», 2012. – 352 с. – Глава 3, §3.1-3.3, с. 181-197.
2. Письменный, Д.Т. Конспект лекций по теории вероятностей, математической статистике и случайным процессам. / Д. Т. Письменный. - М.: Айрис пресс, 2010. – 288 с. - Глава 7, §7.1-7.5, с. 212-224.