Выделение наиболее значимых независимых переменных и их комплексов
Выделение наиболее значимых независимых переменных и их комплексов - раздел Образование, МЕТОДЫ АНАЛИЗА ДАННЫХ
Для Того, Чтобы Определить, Какая Из Независимых Переменных И...
Для того, чтобы определить, какая из независимых переменных или их группа наиболее существенно влияет на зависимую переменную при построении множественной регрессии, нужно в модели, описанные в п.13, внести следующее дополнение. Добавим к числу оптимизируемых коэффициентов двоичные неопределенные переменные , которые могут принимать значения 0 или 1, и в число ограничений на допустимые значения всех оптимизируемых коэффициентов включим следующие:
, (5)
где - количество независимых переменных, которые мы желаем учитывать при построении регрессии, а «очень большое» число, которое заведомо превосходит возможные значения неопределенных коэффициентов в уравнении регрессии.
Дополненная таким образом оптимизационная задача решается с помощью надстройки «Поиск решения» Excell. Напомним, что при этом нужно не забыть объявить переменные как «двоичные». Тогда при оптимальное решение будет включать лишь одну, наиболее значимую независимую переменную, при - лишь две и т.д. Сопоставляя полученное при этом значение критерия с его значением при учете всех независимых переменных, можно увидеть, насколько учет лишь нескольких из них ухудшает результат.
Несколько основных понятий математической статистики
Сразу оговоримся, что материал излагается в упрощенной терминологии и применительно к достаточно узкой сфере возможностей математической статистики, достаточной для выполнения иссле
Гистограмма
Поскольку об объектах генеральной совокупности не известно ничего, кроме значений, которые принимает на каждом из них случайная величина, генеральная совокупность полностью характеризуется совокупн
Закон (плотность) распределения случайной величины
Итак, увеличение количества объектов в выборке практически не меняет вида гистограммы. Однако, если СВ является вещественным числом, то-есть может принимать любые вещественные значе
Нормальный закон распределения
Удивительно, что для большинства генеральных совокупностей, имеющих совершенно разную природу, закон распределения примерно одинаков и отличается только двумя числовыми величинами. Этот закон распр
Функция Лапласа
Поскольку нормальное распределение широко распространено, рассчитаны таблицы значений нескольких связанных с ним функций. Одной из них является функция Лапласа
Основные числовые характеристики выборки
К ним относятся
· наибольшее и наименьшее значение СВ,
· мода – значение СВ, которому отвечает максимальное значение плотности распределения,
· медиана –
Оценка различия двух выборок
Чтобы убедиться, что две выборки действительно различны с точки зрения значений одной и той же СВ, можно использовать три критерия:
· Крамера-Уэлча, если элементы этих выборок не связаны м
Простая регрессия
В простой линейной регрессии предполагается, что зависимая переменная является линей
Множественная регрессия
Множественная регрессия – это аппроксимация зависимости СВ от нескольких независимых переменных величин. Исходными данными является набор векторов
Кластеризация множества объектов
Кластеризация – это разбиение множества объектов, между которыми установлено отношение близости (расстояние), на группы наиболее близких между собой объектов. В каждой группе выделя
Хотите получать на электронную почту самые свежие новости?
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Новости и инфо для студентов