КУРСОВАЯ РАБОТА на тему Статистическая обработка выборки. Статистический анализ работы, использования подвижного состава на железнодорожном транспорте

ФЕДЕРАЛЬНОЕ АГЕНTСТВО ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ

(МИИТ)

Институт экономики и финансов

Кафедра «Бухгалтерский учет и статистика»

КУРСОВАЯ РАБОТА

на тему

«Статистическая обработка выборки. Статистический анализ работы, использования подвижного состава на железнодорожном транспорте»

по дисциплине

«Статистика»

Вариант 13

Выполнил :

студент гр. ЭЭТ-312

Рой Чоудхури Н.

Проверил:

доцент

Сафонов Р.А.

Москва – 2012

 

1.1.

Из данной генеральной совокупности, методом собственно случайного, повторного отбора, мы взяли выборку в 50 чисел, т.е., выбирается любое число из данной генеральной совокупности, случайно, и потом возвращается обратно, тем самым, его можно будет снова выбрать в выборку, если оно снова случайно будет выбрано.

 

Ранжируем в порядке возрастания.

Выборка с повторением (Выборка 1)



 

1.2.

Строим гистограмму.

а) Выделяем количество интервалов гистограммы.

k=1+3,322*LOG1050= 6,643978

k=7

б)

в)Сгруппируем значения выборки с неравными интервалами изменяющимися в возрастающей арифметической прогрессии с константой равной 1,2

 

  (168:185,43) (185,43;206,35) (206,35;231,45) (231,45;261,56) (261,56;297,71)
H 17,43 20,92 25,10 30,11 36,14
h­i
ni 8/50 0,16 20/50 0,4 7/50 0,14 9/50 0,18 6/50 0,12
hH
xi* 176,72 195,89 218,90 246,50 279,64
Zi -1,19349 -0,56631 0,186313 1,089458 1,173231
Ф(Zi) -0,3830 -0,2135 0,0730 0,3621 0,3790

 

 

 

 

 

1.3.

Проверем на нормальный закон распределения

Но: случайная величина подчиняется нормальному закону распределения

Н1: случайная величина не подчиняется нормальному закону распределения

= =934,48 (дисперсия)

= =30,57 (СКО)

=

=

 

Pтi= Ф(Zi)-Ф(Zi-1)

Рт1=-0,2135+0,3830=0,1695

Рт2=0,0730+0,2135=0,2865

Рт3=0,3621-0,0730=0,2891

Рт4=0,3790-0,3621=0,0169

Рт5=0,3790-0,2135=0,1555

 

nт1=0,1695*50=8,475

nт2=0,2865*50=14,325

nт3=0,2891*50=14,445

nт4=0,0169*50=0,845

nт4=0,1555*50=7,775

 

 

 

=85,22

Х2кр= =9,5

Так как Х2экс ˃ Х2кр, то нулевая гипотеза отвергается, принимается альтернативная гипотеза, гласящая о том что наша случайная величина не подчиняется нормальному закону распределения

Из данной генеральной совокупности, методом собственно случайного, бесповторного отбора, мы взяли выборку в 50 чисел, т.е., выбирается любое число из данной генеральной совокупности, случайно, и потом не возвращается обратно, тем самым, его нельзя будет снова выбрать в выборку, если оно снова случайно будет выбрано.

Ранжируем в порядке возрастания.

Выборка без повторения (Выборка 2)


 
 

 

 

1.2.

Строим гистограмму.

А) Выделяем количество интервалов гистограммы.

K=1+3,322*LOG1050= 6,643978

k=7

б)

 

Сгруппируем значения выборки с неравными интервалами изменяющимися в возрастающей арифметической прогрессии с константой равной 1,2

 

  (168:185,43) (185,43;206,35) (206,35;231,45) (231,45;261,56) (261,56;297,71)
H 17,43 20,92 25,10 30,11 36,14
h­i
ni 0,12 0,34 0,2 0,22 0,12
hH
xi* 176,72 195,89 218,90 246,50 279,64
Zi -1,139565 -0,76847 -0,01585 0,887299 1,971022
Ф(Zi) -0,3729 -0,2794 -0,0060 0,3133 0,4756
               

 

 

 

 

 

 

 

1.3.

Проверем на нормальный закон распределения

Но: случайная величина подчиняется нормальному закону распределения

Н1: случайная величина не подчиняется нормальному закону распределения

= =1106,08 (дисперсия)

= =33,26 (СКО)

=

=

 

Pтi= Ф(Zi)-Ф(Zi-1)

Рт1=-0,2794+0,3729=0,0935

Рт2=-0,0060+0,2794=0,2734

Рт3=0,3133+0,0060=0,3193

Рт4=0,4756-0,3133=0,1623

Рт5=0,4756-0,3729=0,1027

 

nт1=0,0935*50=4,675

nт2=0,2734*50=13,67

nт3=0,3193*50=15,965

nт4=0,1623*50=8,115

nт4=0,1027*50=5,135

 

 

 

=4,59

Х2кр= =9,5

Так как Х2экс ­< Х2кр, то нулевая гипотеза принимается, отвергается альтернативная гипотеза, гласящая о том, что наша случайная величина не подчиняется нормальному закону распределения. А значит, она подчиняется НЗР.

 



 

Строим гистограмму.

А) Выделяем количество интервалов гистограммы.

K=1+3,322*LOG10100 = 7,644

k=8

б)

 

Сгруппируем значения выборки с неравными интервалами изменяющимися в возрастающей арифметической прогрессии с константой равной 1,2

 

  133;154,5 154,5;176 176;197,5 197,5;219 219;240,5 240,5;262 262;283,5 283,5;305
H 21,5 21,5 21,5 21,5 21,5 21,5 21,5 21,5
h­i
ni 0,01 0,03 0,22 0,33 0,21 0,11 0,06 0,03
hH
xi* 143,75 165,25 186,75 208,25 229,75 251,25 272,75 294,25

 

 

 

 

Вариант 19

3.1.Определить наличие взаимосвязи между двумя признаками характеризующими работу железнодорожного транспорта.

 

Для анализа работы железнодорожного транспорта взяты два признака:

1. Среднесуточный пробег локомотива в грузовом движении, км/сут

2. Пассажирооборот дальнего сообщения, млрд. пасс.-км (таблица №1).

Для анализа наличия связи между признаками, построим ранжированный ряд по первому признаку и посмотрим как при этом будет происходить изменение признака 2.

Таблица № 1. Показатели работы железнодорожного транспорта

Исходные данные
  Среднесуточный пробег локомотива в грузовом движении, км/сут Пассажирооборот дальнего сообщения, млрд. пасс.-км.
169,3
180,3
140,4
113,5
92,9
80,5
93,1
116,2
106,2
102,1
95,3
89,3

 

 

Из анализа построенных рядов видно, что четкой зависимости между двумя выделенными для анализа признаками нет.

Построим корреляционное поля, на котором наглядно можно увидеть наличие или отсутствие связи между признаками. Для этого по оси абсцисс отметим значение признака 1 - населенность пассажирского вагона, а по оси ординат значение признака 2 - пассажирооборот дальнего сообщения.

На графике видно, что точки расположились вокруг одной нисходящей линии, что свидетельствует о наличии обратной корреляционной связи.

 

 

Рисунок № 1.

 

Более точную оценку связи между двумя признаками дает анализ коэффициента парной корреляции, который характеризует тесноту связи и ее направление.

Парный коэффициент корреляции определяется по формуле:

 

где хi и уi – значения признаков х и у;

и - средние арифметические значения признаков х и у.

 

 

xi yi хi-xcp yi-ycp (хi-xcp)^2 (yi-ycp)^2 (хi-xcp)(yi-ycp)
169,3 -15,7857 55,50714 249,1888 3081,043 -876,22
180,3 -21,7857 66,50714 474,6173 4423,2 -1448,91
140,4 -17,7857 26,60714 316,3316 707,9401 -473,227
113,5 -14,7857 -0,29286 218,6173 0,085765 4,330102
1,214286 -11,7929 1,47449 139,0715 -14,3199
92,9 27,21429 -20,8929 740,6173 436,5115 -568,584
80,5 44,21429 -33,2929 1954,903 1108,414 -1472,02
93,1 -244,786 -20,6929 59920,05 428,1943 5065,316
116,2 -238,786 2,407143 57018,62 5,794337 -574,791
75,21429 -1,79286 5657,189 3,214337 -134,848
106,2 83,21429 -7,59286 6924,617 57,65148 -631,834
102,1 95,21429 -11,6929 9065,76 136,7229 -1113,33
95,3 111,2143 -18,4929 12368,62 341,9858 -2056,67
89,3 116,2143 -24,4929 13505,76 599,9001 -2846,42
477,79 113,79     168416,4 11469,73 -7141,52

Исходя из рассчитанных параметров в таблице № 2, парный коэффициент корреляции равен:

 

Значение парного коэффициента корреляции свидетельствует о наличии слабой обратной связи между признаками. Следовательно, при увеличении среднесуточного пробега локомотива в грузовом движении будет уменьшаться пассажирооборот дальнего сообщения.

Проверим нулевую гипотезу Н0 = (r=0) о равенстве нулю коэффициента корреляции.

В качестве критерия проверки нулевой гипотезы применяют случайную величину:

 

Величина Т при справедливости нулевой гипотезы имеет распределение Стьюдента с k = n – 2 степенями свободы.

Эмпирическое значение Т равно:

 

При уровне значимости α=0,05 и k = 14 – 2=12, табличное значение Стьюдента равно: tкрит = 2,178

Поскольку tэмп = 0,5688 < tкрит = 2,178, то принимается нулевая гипотеза, а значит связь между факторным признаком Х и результативным признаком У отсутствует.

3.2

Рассчитать двухфакторную регрессионную модель.

xi yi xi2 xi*yi xi - x (xi - x)2 yi - y (xi - x)(yi- y)
6,5 81,1 42,25 527,15 -11,18 124,992 -21,725 242,886
8,3 74,2 68,89 615,86 -9,38 87,9844 -28,625 268,503
9,4 87,5 88,36 822,5 -8,28 68,5584 -15,325 126,891
9,5 23,8 90,25 226,1 -8,18 66,9124 -79,025 646,425
9,6 84,3 92,16 809,28 -8,08 65,2864 -18,525 149,682
9,9 81,7 98,01 808,83 -7,78 60,5284 -21,125 164,353
10,1 74,8 102,01 755,48 -7,58 57,4564 -28,025 212,43
11,7 92,6 136,89 1083,42 -5,98 35,7604 -10,225 61,1455
11,9 99,4 141,61 1182,86 -5,78 33,4084 -5,825 33,6685
11,9 141,61 1154,3 -5,78 33,4084 -3,425 19,7965
12,7 94,7 161,29 1202,69 -4,98 24,8004 -8,125 40,4625
12,8 92,9 163,84 1189,12 -4,88 23,8144 -9,925 48,434
14,2 95,5 201,64 1356,1 -3,48 12,1104 -7,325 25,491
15,6 114,8 243,36 1790,88 -2,08 4,3264 11,975 -24,908
20,8 119,8 432,64 2491,84 3,12 9,7344 16,975 52,962
23,3 159,9 542,89 3725,67 5,62 31,5844 57,075 320,762
31,2 124,4 973,44 3881,28 13,52 182,79 21,575 291,694
39,6 151,3 1568,16 5991,48 21,92 480,486 48,475 1062,57
40,8 152,7 1664,64 6230,16 23,12 534,534 49,875 1153,11
43,8 154,1 1918,44 6749,58 26,12 682,254 51,275 1339,3
353,6 2056,5 8872,38 42594,58   2620,73   6235,66

 

Составляется система нормальных уравнений по МНК.

 

 

А2 = ∑(xi - x)(yi - y)/∑(xi - x)2 - суммы i=1 до 20, зн. из таблицы

А2 = 6235.66/2620.732 = 2.37935813353

А1 = y – а2*x, значит

А1 = 102.825 - 2.37935813353*17.68 = 60.7579481992

поэтому y = а2*x + а0 = 2.37935813353*x + 60.7579481992

Посчитаем среднеквадратичные ошибки определения a1 и а2:

т.к. Sb2 = ∑[(yi – а2*xi – а1)2]/(n - 2)*(1/n + (x)2/∑[(xi - x)2]),

то Sb = √6498.58916108/(20 - 2)*(1/20 + 17.682/2620.732) = 7.81748491411

т.к. Sa2 = ∑[(yi – а12*xi – а1)2]/(n - 2)/∑[(xi - x)2],

то Sa = √6498.58916108/(20 - 2)/2620.732 = 0.371160697825

При доверительной вероятности p=0.93: абсолютные ошибки определения а1 и а2;

При такой вероятности p и количестве измерений n=20 кол-во степеней свободы f=19, зн. коэффициент Стьюдента равен t=1.91999159718, тогда:

абсолютные ошибки для а1 и а2:

Δb = t*Sа1 = 1.91999159718*7.81748491411 = 15.0095053462

Δa = t*Sa2 = 1.91999159718*0.371160697825 = 0.712625421028

Последний знак у а0 после запятой по счёту-11й, значит у Δb0 оставляем 12 знаков после запятой

Последний знак у a1 после запятой по счёту-11й, значит у Δа1 оставляем 12 знаков после запятой

Поэтому аппроксимация будет выглядеть так:

y = а2*x + а1, где

а1 = 60.7579481992 ± 15.0095053462;

a2 = 2.37935813353 ± 0.712625421028

Построим точки и график: