Реферат Курсовая Конспект
КУРСОВАЯ РАБОТА на тему Статистическая обработка выборки. Статистический анализ работы, использования подвижного состава на железнодорожном транспорте - раздел Спорт, Федеральное Агенtство Железнодорожного Транспорта...
|
ФЕДЕРАЛЬНОЕ АГЕНTСТВО ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ
(МИИТ)
Институт экономики и финансов
Кафедра «Бухгалтерский учет и статистика»
КУРСОВАЯ РАБОТА
на тему
«Статистическая обработка выборки. Статистический анализ работы, использования подвижного состава на железнодорожном транспорте»
по дисциплине
«Статистика»
Вариант 13
Выполнил :
студент гр. ЭЭТ-312
Рой Чоудхури Н.
Проверил:
доцент
Сафонов Р.А.
Москва – 2012
1.1.
Из данной генеральной совокупности, методом собственно случайного, повторного отбора, мы взяли выборку в 50 чисел, т.е., выбирается любое число из данной генеральной совокупности, случайно, и потом возвращается обратно, тем самым, его можно будет снова выбрать в выборку, если оно снова случайно будет выбрано.
Ранжируем в порядке возрастания.
Выборка с повторением (Выборка 1)
1.2.
Строим гистограмму.
а) Выделяем количество интервалов гистограммы.
k=1+3,322*LOG1050= 6,643978
k=7
б)
в)Сгруппируем значения выборки с неравными интервалами изменяющимися в возрастающей арифметической прогрессии с константой равной 1,2
(168:185,43) | (185,43;206,35) | (206,35;231,45) | (231,45;261,56) | (261,56;297,71) | |
H | 17,43 | 20,92 | 25,10 | 30,11 | 36,14 |
hi | |||||
ni | 8/50 0,16 | 20/50 0,4 | 7/50 0,14 | 9/50 0,18 | 6/50 0,12 |
hH | |||||
xi* | 176,72 | 195,89 | 218,90 | 246,50 | 279,64 |
Zi | -1,19349 | -0,56631 | 0,186313 | 1,089458 | 1,173231 |
Ф(Zi) | -0,3830 | -0,2135 | 0,0730 | 0,3621 | 0,3790 |
1.3.
Проверем на нормальный закон распределения
Но: случайная величина подчиняется нормальному закону распределения
Н1: случайная величина не подчиняется нормальному закону распределения
= =934,48 (дисперсия)
= =30,57 (СКО)
=
=
Pтi= Ф(Zi)-Ф(Zi-1)
Рт1=-0,2135+0,3830=0,1695
Рт2=0,0730+0,2135=0,2865
Рт3=0,3621-0,0730=0,2891
Рт4=0,3790-0,3621=0,0169
Рт5=0,3790-0,2135=0,1555
nт1=0,1695*50=8,475
nт2=0,2865*50=14,325
nт3=0,2891*50=14,445
nт4=0,0169*50=0,845
nт4=0,1555*50=7,775
=85,22
Х2кр= =9,5
Так как Х2экс ˃ Х2кр, то нулевая гипотеза отвергается, принимается альтернативная гипотеза, гласящая о том что наша случайная величина не подчиняется нормальному закону распределения
Из данной генеральной совокупности, методом собственно случайного, бесповторного отбора, мы взяли выборку в 50 чисел, т.е., выбирается любое число из данной генеральной совокупности, случайно, и потом не возвращается обратно, тем самым, его нельзя будет снова выбрать в выборку, если оно снова случайно будет выбрано.
Ранжируем в порядке возрастания.
Выборка без повторения (Выборка 2)
1.2.
Строим гистограмму.
А) Выделяем количество интервалов гистограммы.
K=1+3,322*LOG1050= 6,643978
k=7
б)
Сгруппируем значения выборки с неравными интервалами изменяющимися в возрастающей арифметической прогрессии с константой равной 1,2
(168:185,43) | (185,43;206,35) | (206,35;231,45) | (231,45;261,56) | (261,56;297,71) | |||
H | 17,43 | 20,92 | 25,10 | 30,11 | 36,14 | ||
hi | |||||||
ni | 0,12 | 0,34 | 0,2 | 0,22 | 0,12 | ||
hH | |||||||
xi* | 176,72 | 195,89 | 218,90 | 246,50 | 279,64 | ||
Zi | -1,139565 | -0,76847 | -0,01585 | 0,887299 | 1,971022 | ||
Ф(Zi) | -0,3729 | -0,2794 | -0,0060 | 0,3133 | 0,4756 | ||
1.3.
Проверем на нормальный закон распределения
Но: случайная величина подчиняется нормальному закону распределения
Н1: случайная величина не подчиняется нормальному закону распределения
= =1106,08 (дисперсия)
= =33,26 (СКО)
=
=
Pтi= Ф(Zi)-Ф(Zi-1)
Рт1=-0,2794+0,3729=0,0935
Рт2=-0,0060+0,2794=0,2734
Рт3=0,3133+0,0060=0,3193
Рт4=0,4756-0,3133=0,1623
Рт5=0,4756-0,3729=0,1027
nт1=0,0935*50=4,675
nт2=0,2734*50=13,67
nт3=0,3193*50=15,965
nт4=0,1623*50=8,115
nт4=0,1027*50=5,135
=4,59
Х2кр= =9,5
Так как Х2экс < Х2кр, то нулевая гипотеза принимается, отвергается альтернативная гипотеза, гласящая о том, что наша случайная величина не подчиняется нормальному закону распределения. А значит, она подчиняется НЗР.
Строим гистограмму.
А) Выделяем количество интервалов гистограммы.
K=1+3,322*LOG10100 = 7,644
k=8
б)
Сгруппируем значения выборки с неравными интервалами изменяющимися в возрастающей арифметической прогрессии с константой равной 1,2
133;154,5 | 154,5;176 | 176;197,5 | 197,5;219 | 219;240,5 | 240,5;262 | 262;283,5 | 283,5;305 | |
H | 21,5 | 21,5 | 21,5 | 21,5 | 21,5 | 21,5 | 21,5 | 21,5 |
hi | ||||||||
ni | 0,01 | 0,03 | 0,22 | 0,33 | 0,21 | 0,11 | 0,06 | 0,03 |
hH | ||||||||
xi* | 143,75 | 165,25 | 186,75 | 208,25 | 229,75 | 251,25 | 272,75 | 294,25 |
Вариант 19
3.1.Определить наличие взаимосвязи между двумя признаками характеризующими работу железнодорожного транспорта.
Для анализа работы железнодорожного транспорта взяты два признака:
1. Среднесуточный пробег локомотива в грузовом движении, км/сут
2. Пассажирооборот дальнего сообщения, млрд. пасс.-км (таблица №1).
Для анализа наличия связи между признаками, построим ранжированный ряд по первому признаку и посмотрим как при этом будет происходить изменение признака 2.
Таблица № 1. Показатели работы железнодорожного транспорта
Исходные данные | ||
Среднесуточный пробег локомотива в грузовом движении, км/сут | Пассажирооборот дальнего сообщения, млрд. пасс.-км. | |
169,3 | ||
180,3 | ||
140,4 | ||
113,5 | ||
92,9 | ||
80,5 | ||
93,1 | ||
116,2 | ||
106,2 | ||
102,1 | ||
95,3 | ||
89,3 |
Из анализа построенных рядов видно, что четкой зависимости между двумя выделенными для анализа признаками нет.
Построим корреляционное поля, на котором наглядно можно увидеть наличие или отсутствие связи между признаками. Для этого по оси абсцисс отметим значение признака 1 - населенность пассажирского вагона, а по оси ординат значение признака 2 - пассажирооборот дальнего сообщения.
На графике видно, что точки расположились вокруг одной нисходящей линии, что свидетельствует о наличии обратной корреляционной связи.
Рисунок № 1.
Более точную оценку связи между двумя признаками дает анализ коэффициента парной корреляции, который характеризует тесноту связи и ее направление.
Парный коэффициент корреляции определяется по формуле:
где хi и уi – значения признаков х и у;
и - средние арифметические значения признаков х и у.
xi | yi | хi-xcp | yi-ycp | (хi-xcp)^2 | (yi-ycp)^2 | (хi-xcp)(yi-ycp) |
169,3 | -15,7857 | 55,50714 | 249,1888 | 3081,043 | -876,22 | |
180,3 | -21,7857 | 66,50714 | 474,6173 | 4423,2 | -1448,91 | |
140,4 | -17,7857 | 26,60714 | 316,3316 | 707,9401 | -473,227 | |
113,5 | -14,7857 | -0,29286 | 218,6173 | 0,085765 | 4,330102 | |
1,214286 | -11,7929 | 1,47449 | 139,0715 | -14,3199 | ||
92,9 | 27,21429 | -20,8929 | 740,6173 | 436,5115 | -568,584 | |
80,5 | 44,21429 | -33,2929 | 1954,903 | 1108,414 | -1472,02 | |
93,1 | -244,786 | -20,6929 | 59920,05 | 428,1943 | 5065,316 | |
116,2 | -238,786 | 2,407143 | 57018,62 | 5,794337 | -574,791 | |
75,21429 | -1,79286 | 5657,189 | 3,214337 | -134,848 | ||
106,2 | 83,21429 | -7,59286 | 6924,617 | 57,65148 | -631,834 | |
102,1 | 95,21429 | -11,6929 | 9065,76 | 136,7229 | -1113,33 | |
95,3 | 111,2143 | -18,4929 | 12368,62 | 341,9858 | -2056,67 | |
89,3 | 116,2143 | -24,4929 | 13505,76 | 599,9001 | -2846,42 | |
477,79 | 113,79 | 168416,4 | 11469,73 | -7141,52 |
Исходя из рассчитанных параметров в таблице № 2, парный коэффициент корреляции равен:
Значение парного коэффициента корреляции свидетельствует о наличии слабой обратной связи между признаками. Следовательно, при увеличении среднесуточного пробега локомотива в грузовом движении будет уменьшаться пассажирооборот дальнего сообщения.
Проверим нулевую гипотезу Н0 = (r=0) о равенстве нулю коэффициента корреляции.
В качестве критерия проверки нулевой гипотезы применяют случайную величину:
Величина Т при справедливости нулевой гипотезы имеет распределение Стьюдента с k = n – 2 степенями свободы.
Эмпирическое значение Т равно:
При уровне значимости α=0,05 и k = 14 – 2=12, табличное значение Стьюдента равно: tкрит = 2,178
Поскольку tэмп = 0,5688 < tкрит = 2,178, то принимается нулевая гипотеза, а значит связь между факторным признаком Х и результативным признаком У отсутствует.
3.2
Рассчитать двухфакторную регрессионную модель.
xi | yi | xi2 | xi*yi | xi - x | (xi - x)2 | yi - y | (xi - x)(yi- y) |
6,5 | 81,1 | 42,25 | 527,15 | -11,18 | 124,992 | -21,725 | 242,886 |
8,3 | 74,2 | 68,89 | 615,86 | -9,38 | 87,9844 | -28,625 | 268,503 |
9,4 | 87,5 | 88,36 | 822,5 | -8,28 | 68,5584 | -15,325 | 126,891 |
9,5 | 23,8 | 90,25 | 226,1 | -8,18 | 66,9124 | -79,025 | 646,425 |
9,6 | 84,3 | 92,16 | 809,28 | -8,08 | 65,2864 | -18,525 | 149,682 |
9,9 | 81,7 | 98,01 | 808,83 | -7,78 | 60,5284 | -21,125 | 164,353 |
10,1 | 74,8 | 102,01 | 755,48 | -7,58 | 57,4564 | -28,025 | 212,43 |
11,7 | 92,6 | 136,89 | 1083,42 | -5,98 | 35,7604 | -10,225 | 61,1455 |
11,9 | 99,4 | 141,61 | 1182,86 | -5,78 | 33,4084 | -5,825 | 33,6685 |
11,9 | 141,61 | 1154,3 | -5,78 | 33,4084 | -3,425 | 19,7965 | |
12,7 | 94,7 | 161,29 | 1202,69 | -4,98 | 24,8004 | -8,125 | 40,4625 |
12,8 | 92,9 | 163,84 | 1189,12 | -4,88 | 23,8144 | -9,925 | 48,434 |
14,2 | 95,5 | 201,64 | 1356,1 | -3,48 | 12,1104 | -7,325 | 25,491 |
15,6 | 114,8 | 243,36 | 1790,88 | -2,08 | 4,3264 | 11,975 | -24,908 |
20,8 | 119,8 | 432,64 | 2491,84 | 3,12 | 9,7344 | 16,975 | 52,962 |
23,3 | 159,9 | 542,89 | 3725,67 | 5,62 | 31,5844 | 57,075 | 320,762 |
31,2 | 124,4 | 973,44 | 3881,28 | 13,52 | 182,79 | 21,575 | 291,694 |
39,6 | 151,3 | 1568,16 | 5991,48 | 21,92 | 480,486 | 48,475 | 1062,57 |
40,8 | 152,7 | 1664,64 | 6230,16 | 23,12 | 534,534 | 49,875 | 1153,11 |
43,8 | 154,1 | 1918,44 | 6749,58 | 26,12 | 682,254 | 51,275 | 1339,3 |
353,6 | 2056,5 | 8872,38 | 42594,58 | 2620,73 | 6235,66 |
Составляется система нормальных уравнений по МНК.
А2 = ∑(xi - x)(yi - y)/∑(xi - x)2 - суммы i=1 до 20, зн. из таблицы
А2 = 6235.66/2620.732 = 2.37935813353
А1 = y – а2*x, значит
А1 = 102.825 - 2.37935813353*17.68 = 60.7579481992
поэтому y = а2*x + а0 = 2.37935813353*x + 60.7579481992
Посчитаем среднеквадратичные ошибки определения a1 и а2:
т.к. Sb2 = ∑[(yi – а2*xi – а1)2]/(n - 2)*(1/n + (x)2/∑[(xi - x)2]),
то Sb = √6498.58916108/(20 - 2)*(1/20 + 17.682/2620.732) = 7.81748491411
т.к. Sa2 = ∑[(yi – а12*xi – а1)2]/(n - 2)/∑[(xi - x)2],
то Sa = √6498.58916108/(20 - 2)/2620.732 = 0.371160697825
При доверительной вероятности p=0.93: абсолютные ошибки определения а1 и а2;
При такой вероятности p и количестве измерений n=20 кол-во степеней свободы f=19, зн. коэффициент Стьюдента равен t=1.91999159718, тогда:
абсолютные ошибки для а1 и а2:
Δb = t*Sа1 = 1.91999159718*7.81748491411 = 15.0095053462
Δa = t*Sa2 = 1.91999159718*0.371160697825 = 0.712625421028
Последний знак у а0 после запятой по счёту-11й, значит у Δb0 оставляем 12 знаков после запятой
Последний знак у a1 после запятой по счёту-11й, значит у Δа1 оставляем 12 знаков после запятой
Поэтому аппроксимация будет выглядеть так:
y = а2*x + а1, где
а1 = 60.7579481992 ± 15.0095053462;
a2 = 2.37935813353 ± 0.712625421028
Построим точки и график:
– Конец работы –
Используемые теги: Курсовая, работа, тему, статистическая, обработка, выборки, статистический, анализ, работы, использования, вижного, состава, железнодорожном, транспорте0.166
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: КУРСОВАЯ РАБОТА на тему Статистическая обработка выборки. Статистический анализ работы, использования подвижного состава на железнодорожном транспорте
Если этот материал оказался полезным для Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Новости и инфо для студентов