Метод найменших квадратів

Ідею методу найменших квадратів (МНК) вчені сформулювали ще на початку ХІХ ст., а саме англієць Гаус і француз Лежандр. Але МНК як метод оцінювання параметрів рівнянь регресії, був опрацьований пізніше російським математиком М. Чебишевим в монографії “Об интерполировании по методу наименьших квадратов”, що вийшла друком у 1859 р.

Метод найменших квадратів (МНК) заснований на вимозі, щоб

S (y - ŷ)² → min, (3.1)

тобто щоб відхилення точок поля кореляйії від прямої регресії (залишки е) були найменшими. Відхилення y – ŷє помилкою оцінювання, бо залишки е не пояснюється рівнянням регресії (див. рис. 3.1.).

Ми можемо визначити величину цих помидок тільки для об’єктів спостережень (точок поля), але для інших можливих комбінацій y і х вони невідомі. Цілком природно за “найкращу” пряму лінію регресії вибрати таку, для якої б сума квадратів залишків приймала найменше Рис.3.1 − Залишки, що не значення, тобто

пояснюються регресією.

= (y – – x)² =→ min.

Необхідною умовою мінімуму є рівність нулю частинних похідних цієї функції по і :

= –2=0;

= –2 =0

Розкривши дужки, отримаємо систему нормальних рівнянь з невідомими і :

= a₀+ a₁; (3.2)

= a₀+ a₁.

Наведемо давно підмічені правила і приклади складання системи нормальних рівнянь для будь – яких форм рівняння регресії. Правило перше: перше рівняння системи отримуємо, сумуючи рівняння регресії за всіма спостереженнями змінних. Наприклад, для трифакторної лінійної регресії

y = α_о + α₁ x₁ + α₂ x₂ + α₃ x₃

перше рівняння системи за цим правилом матиме вигляд

S y = α_о S 1 + α₁ S x₁ + α₂ S x₂ + α₃ S x₃

Друге правило: друге, третє і всі інші рівняння систем отримують множенням першого рівняння на співмножники відповідно при а₁,а₂ и т.д. у рівнянні регресії. У даному випадку множенням першого рівняння відповідно на x₁, x₂ та x₃ отримаємо друге, третє і четверте рівняння системи

S y x₁ = α_о S x₁ + α₁ S x₁² + α₂ S x₂x₁ + α₃ S x₃x₁,

S y x₂ = α_о S x₂ + α₁ S x₁ x₂ + α₂ S x₂² + α₃ S x₃x₂,

S y x₃ = α_о S x₃ + α₁ S x₁ x₃ + α₂ S x₂x₃ + α₃ S x₃².

Ще приклад. Нехай рівняння регресії має степеневу форму

y = α_о.

Лінеаризуємо його

ℓg y = ℓg α_о+ α₁ℓgx.

Система нормальних рівнянь для визначення ℓg α_о і α₁, складена за наведеними щойно правилами, приймає такий вигляд:

S ℓg y = ℓg α_о S1 + α₁ S ℓgx,

S ℓg y ℓgx = ℓg α_оS ℓgx + α₁S (ℓgx)².

У нашому наскрізному прикладі моделювання залежності рентабельності від двох факторів

Р = α_о+ α₁ Е + α₂К

система нормальних рівнянь для оцінювання α_о, α₁, та α₂ складена за наведеними вище правилами, така:

S Р = α_оS 1 + α₁ S Е + α₂S К,

S РЕ = α_оS Е + α₁ S Е² + α₂S К Е,

S РК = α_оS К + α₁ S ЕК + α₂S К².

За даними табл. 1.5. і 2.1 перепишемо цю систему рівнянь в числах:

282,6 = 29 α_о + 136,6 α_Е+ 1740 α_К,

1425,26 = 136,6 α_о + 754,72 α_Е+ 8567,7 α_К, (3.3)

17413,9 = 1740 α_о + 8567,7 α_Е+ 108164 α_К.

Нижче розглядаються декілька можливих способів розв’язання системи нормальних рівнянь.