Билет 3

5. Понятие уравнение регрессии, цель и задачи его построения.Регрессионный анализ – это метод изучения статистической взаимосвязи между одной количественной зависимой переменной от одной или нескольких количественных переменных факторов.

Цель регрессионного анализа – с помощью уравнения регрессии предсказать ожидаемое среднее значение результирующей переменной.

Основные задачи регрессионного анализа следующие:

1. определения вида и формы зависимости;

2. оценка параметров уравнения регрессии;

3. проверка значимости уравнения регрессии;

4. проверка значимости отдельных коэффициентов уравнения;

5. построение интервальных оценок коэффициентов;

6. исследование характеристик точности модели;

7. построение точечных и интервальных прогнозов результирующей переменной.

8. Как и корреляционный анализ регрессионный анализ отражает только количественные зависимости между переменными.

9. Причинно-следственные зависимости регрессионный анализ не отражает.

Гипотезы о причиной связи переменных должны формулироваться и обосновываться исходя из теоретического анализа содержания изучаемого явления.

6. Регрессионные модели с бинарной зависимой переменной, логит-и пробит-модели. Оценивание параметров с помощью метода максимального правдоподобия.Модель бинарного выбора — применяемая в эконометрике модель зависимости бинарной переменной (принимающей всего два значения — 0 и 1) от совокупности факторов. Построение обычной линейной регрессии для таких переменных теоретически некорректно, так как условное математическое ожидание таких переменных равно вероятности того, что зависимая переменная примет значение 1, а линейная регрессия допускает и отрицательные значения и значения выше 1. Поэтому обычно используются некоторые интегральные функции распределения. Чаще всего используются нормальное распределение (пробит), логистическое распределение (логит).

Прот-регрессия — применяемая в различных областях статистическая (нелинейная) модель и метод анализа зависимости качественных (в первую очередь — бинарных) переменных от множества факторов, основанная на нормальном распределении.

В пробит-модели в качестве используется интегральная функция стандартного нормального распределения :

Логистиское распределение — один из видов абсолютно непрерывных распределений. Формой напоминает нормальное распределение, но имеет более «тяжёлые» концы и больший коэффициент эксцесса.

В логит-модели используется CDF логистического распределения:

Гомпит. Используется распределение экстремальных значений - распределение Гомперца:

Оценка обычно производится методом максимального правдоподобия. Пусть имеется выборка объёма факторов и зависимой переменной . Для данного номера наблюдения используем индекс . Вероятность получения в наблюдении значения можно смоделировать следующим образом:

В самом деле, если , то второй множитель очевидно равен 1, а первый как раз , если же , то первый множитель равен единице, а второй — . Предполагается, что данные независимы. Поэтому функцию правдоподобия можно получить как произведение вышеуказанных вероятностей:

Соответственно логарифмическая функция правдоподобия имеет вид:

Максимизация данной функции по неизвестным параметрам позволяет получить состоятельные, асимптотически эффективные и асимптотически нормальные оценки параметров. Последнее означает, что: где — асимптотическая ковариационная матрица оценок параметров, которая определяется стандартным для метода максимального правдоподобия способом (через гессиан или градиент логарифмической функции правдоподобия в оптимальной точке).