План лекции

6.1. Основные понятия математической статистики

6.2. Точечные оценки параметров

6.3. Примеры некоторых распределений

 

6.1. Основные понятия математической статистики

Математическая статистика – это раздел математики, посвящённый анализу статистических данных самой разнообразной природы. Есть определённая связь математической статистики с теорией вероятностей, которая не случайно изучается раньше. В теории вероятностей име­ют де­ло с ве­ро­ят­но­стя­ми слу­чай­ных со­бы­тий, а так­же со слу­чай­ны­ми ве­ли­чи­на­ми и их ха­рак­те­ри­сти­ка­ми. При этом пред­по­ла­га­ется, что ин­те­ре­сую­щие нас ве­ро­ят­но­сти ли­бо из­вест­ны, ли­бо их мож­но рас­счи­тать. Но в прак­ти­че­ских за­да­чах по­ло­же­ние иное. Во вре­мя про­ве­де­ния опы­тов фик­си­ру­ют­ся кон­крет­ные зна­че­ния слу­чай­ной ве­ли­чи­ны, по ко­то­рым за­тем нуж­но оп­ре­де­лить её чи­сло­вые ха­рак­те­ри­сти­ки и за­кон рас­пре­де­ле­ния ве­ро­ят­но­стей. Осо­бен­но­стью за­да­чи в по­дав­ляю­щем чис­ле слу­ча­ев яв­ля­ет­ся не­воз­мож­ность об­сле­до­вать все объ­ек­ты на­блю­де­ния, а зна­чит, имея в на­ли­чие толь­ко ог­ра­ни­чен­ное ко­ли­че­ст­во из­ме­ре­ний, нам не­об­хо­ди­мо сде­лать вы­вод о по­ве­де­нии всей со­во­куп­но­сти объ­ек­тов.

Всё мно­же­ст­во ис­сле­дуе­мых объ­ек­тов на­зы­ва­ет­ся ге­не­раль­ной со­во­куп­но­стью. Чис­ло объ­ек­тов на­зы­ва­ет­ся объ­ё­мом ге­не­раль­ной со­во­куп­но­сти. Объ­ём ге­не­раль­ной со­во­куп­но­сти яв­ля­ет­ся ко­неч­ным в от­ли­чие от тео­ре­ти­че­ских рас­смот­ре­ний, где он пред­по­ла­га­ет­ся бес­ко­неч­ным.

Мно­же­ст­во слу­чай­ным об­ра­зом ото­бран­ных объ­ек­тов ис­сле­до­ва­ния на­зы­ва­ет­ся вы­бо­роч­ной со­во­куп­но­стью или вы­бор­кой, а чис­ло объ­ек­тов в вы­бор­ке – её объ­ё­мом. Про­из­ве­дён­ная вы­бор­ка долж­на дос­та­точ­но пол­но от­ра­жать свой­ст­ва всех объ­ек­тов ге­не­раль­ной со­во­куп­но­сти. Осо­бен­но это важ­но, ко­гда ге­не­раль­ная со­во­куп­ность име­ет не­ко­то­рую не­од­но­род­ность объ­ек­тов. Та­кое тре­бо­ва­ние к вы­бор­ке фор­му­ли­ру­ет­ся так: вы­бор­ка долж­на быть ре­пре­зен­та­тив­ной (пред­ста­ви­тель­ной). Ре­пре­зен­та­тив­ность вы­бор­ки обес­пе­чи­ва­ет­ся слу­чай­но­стью от­бо­ра при оди­на­ко­вой ве­ро­ят­но­сти лю­бо­го объ­ек­та по­пасть в вы­бор­ку.

Про­ил­лю­ст­ри­ру­ем это по­ня­тие на при­ме­ре. До­пус­тим, что на­се­ле­ние го­ро­да со­став­ля­ет 100 000 че­ло­век, сре­ди ко­то­рых 60% - бед­ня­ки, 30% - сред­ний класс, а ос­таль­ные - бо­га­чи. Тре­бу­ет­ся оце­нить сред­не­го­до­вой до­ход на ду­шу на­се­ле­ния. По­сколь­ку нет ни фи­нан­со­вых, ни фи­зи­че­ских воз­мож­но­стей оп­ро­сить всех жи­те­лей го­ро­да, то ре­ши­ли сде­лать вы­бор­ку из 1000 че­ло­век, и по ре­зуль­та­там оп­ро­са оце­нить сред­не­го­до­вой до­ход. Что­бы вы­бор­ка бы­ла ре­пре­зен­та­тив­ной, сле­ду­ет слу­чай­ным об­ра­зом вы­брать для оп­ро­са при­бли­зи­тель­но 600 бед­ня­ков, 300 че­ло­век со сред­ним дос­тат­ком и 100 бо­га­чей. Толь­ко в этом слу­чае сред­нее ариф­ме­ти­че­ское их го­до­вых до­хо­дов бу­дет хо­ро­шей оцен­кой сред­не­го­до­во­го до­хо­да жи­те­лей это­го го­ро­да.

Те­перь пе­рей­дем к фор­маль­ной сто­ро­не ма­те­ма­ти­че­ской ста­ти­сти­ки, ко­то­рая, как уже говорилось, оп­ре­де­ля­ет­ся как раз­дел ма­те­ма­ти­ки, по­свя­щён­ный ма­те­ма­ти­че­ским ме­то­дам сис­те­ма­ти­за­ции, об­ра­бот­ки и ис­поль­зо­ва­ния ста­ти­сти­че­ских дан­ных для на­уч­ных и прак­ти­че­ских вы­во­дов вне за­ви­си­мо­сти от при­ро­ды изу­чае­мых объ­ек­тов.

Пусть име­ет­ся ге­не­раль­ная со­во­куп­ность слу­чай­ной ве­ли­чи­ны Х (в при­ве­дён­ном вы­ше при­ме­ре - ин­ди­ви­ду­аль­ные до­хо­ды 100 000 го­ро­жан), функ­ция рас­пре­де­ле­ния F(x) ко­то­рой нам не­из­вест­на, ли­бо из­вест­на с точ­но­стью до не­сколь­ких па­ра­мет­ров. То­гда вы­бор­кой объ­ё­ма n бу­дет яв­лять­ся слу­чай­ный n - мер­ный век­тор, имею­щий “ко­ор­ди­на­ты” {х1, х2, ... , хn} (в примере – до­хо­ды слу­чай­ным об­ра­зом ото­бран­ных n го­ро­жан). Ста­вит­ся за­да­ча: по имею­щей­ся вы­бор­ке оце­нить ос­нов­ные чи­сло­вые ха­рак­те­ри­сти­ки слу­чай­ной ве­ли­чи­ны Х (ма­те­ма­ти­че­ское ожи­да­ние, дис­пер­сию) или сде­лать вы­вод о ви­де функ­ции рас­пре­де­ле­ния.

По­сколь­ку вы­бор­ка слу­чай­на, то ко­ор­ди­на­ты n - мер­но­го век­то­ра хi не­упо­ря­до­че­ны, т.е., во-пер­вых, сре­ди них мо­гут встре­тить­ся оди­на­ко­вые ве­ли­чи­ны (рав­ные до­хо­ды), а во-вто­рых, мо­жет вы­пол­нять­ся лю­бое из не­ра­венств: хi+1 > > xi или хi+1 < xi. Для удоб­ст­ва ра­бо­ты с вы­бор­кой зна­че­ния xi пе­ре­став­ля­ют так, что­бы вы­пол­ня­лись не­стро­гие не­ра­вен­ст­ва: х1 £ х2 £ х3 £ ... £ хn. Та­кая пе­ре­ста­нов­ка не при­ве­дет ни к по­те­ре ин­фор­ма­ции, ни к её при­об­ре­те­нию (про­сто оп­рос тех же го­ро­жан про­во­дил­ся бы в ином по­ряд­ке).

Не­ко­то­рые зна­че­ния в вы­бор­ке мо­гут сов­па­дать. До­пус­тим, все­го име­ет­ся k (1 £ k £ n) раз­ных и рас­по­ло­жен­ных в по­ряд­ке воз­рас­та­ния зна­че­ний ; их на­зы­ва­ют ва­ри­ан­та­ми, а та­кую по­сле­до­ва­тель­ность чи­сел – ва­риа­ци­он­ным ря­дом. Раз­ность -ме­ж­ду наи­боль­шим и наи­мень­шим зна­че­ния­ми вы­бор­ки на­зы­ва­ют раз­ма­хом вы­бор­ки. До­пус­тим, зна­че­ние по­вто­ря­ет­ся ni раз (1 £ i £ k) при со­блю­де­нии ра­вен­ст­ва . Ве­ли­чи­ну ni на­зы­ва­ют час­то­той ва­ри­ан­ты , а от­но­ше­ние ni / n от­но­си­тель­ной час­то­той Wi. Лег­ко убе­дить­ся, что сум­ма от­но­си­тель­ных час­тот рав­на еди­ни­це: .

Дан­ные ва­риа­ци­он­но­го ря­да за­но­сим в таб­ли­цу, верх­нюю стро­ку ко­то­рой за­пол­ним ва­ри­ан­та­ми , ,..., , а ниж­нюю - со­от­вет­ст­вую­щи­ми от­но­си­тель­ны­ми час­то­та­ми . Та­кая таб­ли­ца на­зы­ва­ет­ся таб­ли­цей ста­ти­сти­че­ско­го рас­пре­де­ле­ния вы­бор­ки или про­сто ста­ти­сти­че­ской таб­ли­цей. Ста­ти­сти­че­ская таб­ли­ца в слу­чае от­сут­ст­вия по­вто­ряю­щих­ся зна­че­ний в ва­риа­ци­он­ном ря­ду име­ет вид табл. 6.1, а для вы­бор­ки с по­вто­ряю­щи­ми­ся зна­че­ния­ми - табл. 6.2.

 

Wi 1/n 1/n 1/n 1/n 1/n

Табл. 6.1

Wi

Табл.6.2

Заметим, что таб­ли­цу ста­ти­сти­че­ско­го рас­пре­де­ле­ния вы­бор­ки можно считать таблицей рас­пре­де­ле­ния некоторой гипотетической слу­чай­ной дис­крет­ной ве­ли­чи­ны, при­ни­ма­ющей зна­че­ния ,,...,с ве­ро­ят­но­стя­ми . В си­лу этой ана­ло­гии мож­но по тем же фор­му­лам, ко­то­рые ис­поль­зо­ва­лись для дис­крет­но­го рас­пре­де­ле­ния в теории вероятностей, по из­вест­но­му эм­пи­ри­че­ско­му рас­пре­де­ле­нию най­ти вы­бо­роч­ные ана­ло­ги ма­те­ма­ти­че­ско­го ожи­да­ния, дис­пер­сии и эм­пи­ри­че­ской функ­ции рас­пре­де­ле­ния.

Ес­ли объ­ём вы­бор­ки из ге­не­раль­ной со­во­куп­но­сти не­ко­то­рой слу­чай­ной не­пре­рыв­ной ве­ли­чи­ны ве­лик, то при­бе­га­ют к пред­ва­ри­тель­ной груп­пи­ров­ке дан­ных: ин­тер­вал зна­че­ний этой ве­ли­чи­ны раз­би­ва­ют на k ин­тер­ва­лов (при этом их дли­ны не обя­за­тель­но долж­ны быть оди­на­ко­вы). При вы­бо­ре ко­ли­че­ст­ва ин­тер­ва­лов ру­ко­во­дствуются фор­му­лой k = log2 n + 1 . Под­счи­ты­ва­ют, сколь­ко зна­че­ний n1 , n2 , ... , nk по­па­ло в ка­ж­дый из k ин­тер­ва­лов (n1 + n2 + ... + nk = = n). Ва­ри­ан­та­ми для груп­пи­ро­ван­ной вы­бор­ки считают се­ре­ди­ны этих ин­тер­ва­лов ,,...,. Эти дан­ные за­но­сят в ста­ти­сти­че­скую таб­ли­цу рас­пре­де­ле­ния вы­бор­ки (табл. 6.2).

Для на­гляд­но­го пред­став­ле­ния ста­ти­сти­че­ско­го рас­пре­де­ле­ния поль­зу­ют­ся гра­фи­че­ски­ми изо­бра­же­ния­ми ва­риа­ци­он­ных ря­дов: по­ли­го­ном (для слу­чай­ной дис­крет­ной ве­ли­чи­ны) и гис­то­грам­мой (для не­пре­рыв­ной). По­ли­гон по­лу­ча­ют, со­еди­няя от­рез­ка­ми пря­мых точ­ки с ко­ор­ди­на­та­ми (,), i = 1,..., k. Он яв­ля­ет­ся ана­ло­гом мно­го­уголь­ни­ка рас­пре­де­ле­ния слу­чай­ной дис­крет­ной ве­ли­чи­ны в тео­рии ве­ро­ят­но­стей. Гис­то­грам­ма - это ряд пря­мо­уголь­ни­ков, ос­но­ва­ния­ми ко­то­рых яв­ля­ют­ся от­рез­ки длиной - , а их вы­со­ты рав­ны . При та­ком вы­бо­ре сто­рон пря­мо­уголь­ни­ков дос­ти­га­ет­ся ра­вен­ст­во еди­ни­це пло­ща­ди всей этой сту­пен­ча­той фи­гу­ры. Гис­то­грам­ма яв­ля­ет­ся ана­ло­гом плот­но­сти ве­ро­ят­но­стей слу­чай­ной не­пре­рыв­ной ве­ли­чи­ны. При­ме­ры по­ли­го­на и гис­то­грам­мы при­ве­де­ны со­от­вет­ст­вен­но на рис. 5.1 и 5.2 .

Wi

 

x1 x2 x3 x4 х5 x6 x7 x

Рис. 6.1

Wi

 
 


       
   
 
 

 


х

Рис. 6.2

Рас­смат­ри­вая эти гра­фи­ки, мож­но вы­ска­зать пред­по­ло­же­ние, что в пер­вом слу­чае слу­чай­ная ве­ли­чи­на име­ет рав­но­мер­ное рас­пре­де­ле­ние, а во вто­ром - нор­маль­ное. Оцен­ка пра­во­мер­но­сти этих ги­по­тез со­став­ля­ет от­дель­ную гла­ву ма­те­ма­ти­че­ской ста­ти­сти­ки.

П р и м е р № 1. На при­ём­ных эк­за­ме­нах слу­чай­ная вы­бор­ка сре­ди аби­ту­ри­ен­тов да­ла сле­дую­щие на­бран­ные ими бал­лы: 12. 11, 12, 10, 10, 9, 14, 12, 13, 10, 11, 11, 15, 9, 12, 12, 11, 9, 9, 10, 11, 11, 14, 13, 9, 11, 12, 9, 11, 13. По­стро­ить для дан­ной вы­бор­ки ва­риа­ци­он­ный ряд, по­ли­гон и эм­пи­ри­че­скую функ­цию рас­пре­де­ле­ния, най­ти мо­ду и ме­диа­ну.

Р е ш е н и е . Рас­по­ло­жим дан­ные вы­бор­ки в по­ряд­ке их воз­рас­та­ния, или дру­ги­ми сло­ва­ми, со­ста­вим ва­риа­ци­он­ный ряд: 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 11, 11, 11, 11, 11, 11, 11, 11, 12, 12, 12, 12, 12, 12, 1, 13, 13, 14, 14, 15. Чис­ла яв­ля­ют­ся ва­ри­ан­та­ми с чис­лом по­вто­ре­ний со­от­вет­ст­вен­но n1 = 6, n2 = 4, n3 = 8, n4 = 6, n5 = 3, n6 = 2, n7 = 1. Объ­ём вы­бор­ки ра­вен n =. Дан­ные за­не­сём в ста­ти­сти­че­скую таб­ли­цу рас­пре­де­ле­ния вы­бор­ки (табл. 6.3).

 

Wi 6/30 4/30 8/30 6/30 3/30 2/30 1/30