Приклади.

 

Часто необхідно знати закон розподілу ознаки у генеральній сукупності. Наприклад, є підстави вважати, що він має вигляд А. Тоді висувають гіпотезу (припущення): генеральна сукупність розподілена за законом А.У цій гіпотезі йде мова про вигляд невідомого закону розподілу. Іноді закон розподілу генеральної сукупності відомий, але його параметри (числові характеристики) невідомі. Тоді висувають гіпотезу: невідомий параметр дорівнює .Ця гіпотеза вказує припущену величину параметра відомого розподілу. Можливі інші гіпотези: про рівність параметрів двох різних розподілів, про незалежність вибірок тощо.

Означення. Статистичниминазивають гіпотези про вигляд розподілу генеральної сукупності або про параметри відомих розподілів.

Наприклад, статистичними будуть гіпотези: а) генеральна сукупність розподілена за нормальним законом; б) дисперсії двох сукупностей, розподілених за законом Пуассона, рівні між собою.

Приклад нестатистичної гіпотези (оскільки не йде мова ні про вигляд закону розподілу, ні про його параметри): значна частина людей, народжених у другому півріччі, має краще розвинену праву частину мозку, яка здійснює образне мислення.

Разом із припущеною гіпотезою завжди можна розглядати протилежну їй гіпотезу, які доцільно розрізняти.

Означення. Основною (нульовою)називають припущену гіпотезу і позначають .

Означення. Альтернативною (конкурентною)називають гіпотезу, що суперечить основній і позначають .

Наприклад, якщо , то .

Гіпотези можуть містити тільки одне припущення ( прості) або більше одного припущення ( складні). Наприклад, якщо - параметр показникового розподілу, то гіпотеза - проста, а гіпотеза - складна (містить нескінченну множину гіпотез).

Статистична гіпотеза, яка висунута, може бути правильною або неправильною, тому виникає необхідність її статистичної перевірки(перевірка за даними вибірки). При цьому за даними випадкової вибіркиможна зробити хибний висновок.

Означення. Якщо за висновком буде відкинута правильна гіпотеза, то кажуть, що це похибка першого роду.

Означення. Якщо за висновком буде прийнята хибна гіпотеза, то кажуть, що це похибка другого роду.

Відмітимо, що наслідки похибок другого роду більш небезпечні, ніж наслідки похибок першого роду.

Означення. Імовірність здійснити похибку першого роду називають рівнем значущості.

Рівень значущості найчастіше позначають і приймають рівним 0,01 або 0,05. Якщо , то це значить, що в п’яти випадках із 100 ми ризикуємо дістати похибку першого роду (відкинути правильну гіпотезу).

Наприклад, при контролі якості продукції імовірність признати неякісними якісні вироби називають ризиком виробника, а імовірність признати якісними неякісні вироби називають ризиком споживача.

КРИТЕРІЇ УЗГОДЖЕННЯ ДЛЯ ПЕРЕВІРКИ ГІПОТЕЗ.

 

Означення. Статистичним критерієм узгодження перевірки гіпотези (або просто критерієм ) називають випадкову величину К (вибіркову функцію), розподіл якої (точний або наближений) відомий і яка застосовується для перевірки основної гіпотези.

Зауваження. Якщо статистична характеристика (вибіркова функція) розподілена нормально, то критерій позначають не буквою К, а літерою Z (а процес перевірки Z-тестуванням). Якщо статистична характеристика розподілена за законом Фішера-Снедекора, то її позначають F ( F–тестування). У випадку розподілу статистичної характеристики за законом Стьюдента її позначають t (t–тестування), а у випадку закону “хі-квадрат” - (-тестування).

Означення. Спостереженим значенням критерію узгодженняназивають значення відповідного критерію, обчислене за даними вибірки.

Означення. Критичною областюназивають множину можливих значень критерію, при яких основна гіпотеза відхиляється. Є однобічні та двобічні критичні області.

Означення. Областю прийняття гіпотези (областю допустимих значень)називають множину можливих значень критерію, при яких основна гіпотеза приймається.

Для знаходження критичних областей (та областей прийняття гіпотез) задають рівень значущості , визначають кількості ступенів вільності (це поняття буде розглянуто далі), а потім шукають критичну точку із умови у випадку правобічної критичної області. Ця точка відокремлює критичну область від області прийняття гіпотези.

Зауваження. Єдиним способом одночасного зменшення імовірностей похибок першого та другого роду є збільшення об’єму вибірки.

КРИТЕРІЙ УЗГОДЖЕННЯ ПІРСОНА (-КРИТЕРІЙ).

Критерій Пірсона ефективно використовують для перевірки гіпотези про розподіл генеральної сукупності (теоретичний розподіл). Критерієм перевірки основної гіпотези про вигляд теоретичного розподілу беруть випадкову величину , що визначається через порівняння емпіричних (вибіркових) та теоретичних частот. Ця ВВ не залежить від виду закону, а залежить тільки від рівня значущості та кількості ступенів вільності , яка визначається як різниця між зменшеною на одиницю кількістю варіант (або інтервалів варіант) та кількістю параметрів розподілу. Тобто , де - кількість варіант (або інтервалів варіант), а - кількість параметрів розподілу.

Критичне значення (критична точка) знаходиться за відповідними таблицями (або за спеціальними функціями Excel).

Правило Пірсона. Щоб при заданому рівні значущостіперевірити основну гіпотезу : генеральна сукупність розподілена за певним законом, потрібно:

1) припустити наявність певного закону розподілу, знайти його параметри та побудувати (записати) цей закон;

2) обчислити за цим законом теоретичні частоти для кожної варіанти (або інтервалу варіант);

3) обчислити спостережене значення критерію за формулою

;

4) знайти за таблицями критичну точку;

5) порівняти та і зробити висновок:

якщо <, то гіпотеза приймається,

якщо >, то гіпотеза відхиляється.

Для нашого приклада (див.аналіз вибіркових даних на попередній лекції) висунемо основну гіпотезу : платня усіх робітників фірми (генеральна сукупність) розподілена за нормальним законом з параметрами:

математичне сподівання грн.

стандарт грн.

Щільність розподілу імовірностей (диференціальна функція):

.

Функція розподілу імовірностей (інтегральна функція):

, де - інтегральна функція Лапласа.

 

Усі подальші розрахунки див. на Додатку 5 (інтервали з теоретичними або емпіричними частотами, меншими 5, приєднуються до сусідніх). За таблицями (або за спеціальними функціями Excel) для рівня значущості при кількості ступенів вільності : .

ВИСНОВОК: оскільки <, то гіпотеза : платня усіх робітників фірми (генеральна сукупність) розподілена за нормальним законом приймається