Мета роботи

 

Отримання студентами практичних навичок розрахунку описових статистик: математичного сподівання, дисперсії, середньоквадратичного відхилення.

 

1.2 Методичні рекомендації до самостійної роботи студентів

Описові статистики служать для опису найзагальніших характеристик спостережуваних величин. У системі STATISTICA описові статистики обчислюються декількома клацаннями миші.

До числа основних описових статистик відносяться: середня, вибіркова дисперсія, стандартне відхилення, медіана, мода, максимальне і мінімальне значення, розмах, квантилі.

Середнє М, або, точніше, оцінка середнього, обчислюється просто як середнє арифметичне спостережень. Оцінку середнього називають також вибірковим середнім. Нехай ви спостерігаєте значення X(1)...X(N), наприклад, відзначаєте час, коли ви прокидаєтеся вранці.

Формула для вибіркового середнього має вигляд [1, с.38]:

M = (X (1 )+... X (N)) / N.

Якщо протягом трьох днів ви прокидалися о 7.00, 8.30, 6.15, то середній час вашого підйому – 7год. 15 хв.

Вибіркове середнє є тією точкою, сума відхилень від якої усіх розглянутих спостережень дорівнює 0.

Формально це записується наступним чином:

(M-X (1)) + (M-X (2 ))+...+( M-X (N)) = 0.

Вправа: використовуючи визначення зрізні, переконайтеся, що дана властивість дійсно має місце, тобто сума відхилень спостережуваних значень від середнього арифметичного дійсно дорівнює 0.

Вибіркове середне – єдина точка, яка має такі властивості, і це виділяє її серед всіх інших.

Крім того, вибіркове середнє має ще одну чудову властивість: сума квадратів відстаней між значеннями, що спостерігаються, та їх середнім арифметичним є мінімальною. Якщо замість середнього арифметичного взяти будь – яку іншу величину, то сума квадратів відстані, що спостерігається, і цією величиною буде тільки більше (див. наприклад, книгу Г. Кімбла "Як правильно користуватися статистикою"), але ніяк не менше.

У наступній таблиці наведені значення доходу фірми, виражені в мільйонах рублів (рис.1.1)[2, с.182].

 

Рисунок 1.1

 

Доходи вимірювалися протягом 5 днів (робочий тиждень).

Середній дохід у день дорівнює:

 

 

Рисунок 1.2 – Таблиця в STATISTICA з обчисленим середнім доходом

 

Це частина стандартної таблиці виведення описових статистик у системі. У колонці Mean (Середнє) показано значення середнього доходу в день – 96,8 млн. руб.

Вправа: перевірте на калькуляторі, що обчислено дійсно середнє значення доходу.

Іншими важливими статистичними показниками є вибіркова дисперсія та стандартне відхилення.

Вибіркова дисперсія визначається як [3, с. 90]:

((X (1)-m (n )))** 2 +...+( X (N)-m (n)) ** 2) / (n-1)

Вибіркова оцінка є переконлива оцінка дисперсії розподілу.

Корінь квадратний з вибіркової дисперсії є стандартним відхиленням.

Стандартне відхилення дорівнює кореню квадратному із суми квадратів відхилень спостережуваних значень від середнього, поділеній на N–1, де N-число спостережень (див., наприклад, довідник Полларда "Довідник з обчислювальних методів статистики").

Стандартне відхилення є важливою характеристикою, воно зустрічається у багатьох таблицях виведення і графіках STATISTICA.

До інших важливих характеристик відносяться: мода, медіана, квантиль.

Мода – це значення розподілу (відповідно до звичайного значення цього слова), що найбільш часто зустрічається. Вона добре описує, наприклад, типову реакцію водіїв на сигнал світлофора про припинення руху.

Медіана – це середина спостереження у вибірці. Більш точно: нехай є вихідна вибірка даних, що мають чисельне значення X(1)… X(2)… X(n).

Впорядкуємо їх за зростанням. Впорядкування за зростанням значен називається варіаційнним рядом:

X(1)< X(2)<…< X(n).

Серединне значення в цьому ряді називається медіаною [4, с.59].

Якщо бути більш точним, то слід сказати так: при непарній N медіана є значенням із ряду з номером (N-1) / 2, при парному N медіана є півсумою значень з номерами N / 2 і N / 2 +1.

X(1) – мінімальне значення вибірки, X(n) – максимальне значення. Різниця між максимальним і мінімальним значенням називається розмахом.