рефераты конспекты курсовые дипломные лекции шпоры

Раздел Философия
/
Обработка "плохих" данных

Реферат Курсовая Конспект

Выберите учебное заведение

Обработка "плохих" данных

Обработка "плохих" данных - раздел Философия, ТЕОРИЯ ЭКСПЕРИМЕНТА В ОМД КОНСПЕКТ ЛЕКЦИЙ ПО КУРСУ «ТЕОРИЯ ЭКСПЕРИМЕНТА» Если В Результате Эксперимента Все Же Получены Данные С Мультиколлинеарностью...

Если в результате эксперимента все же получены данные с мультиколлинеарностью, то можно попытаться получить приемлемую по статистическим качествам модель посредством специальных способов обработки данных.

Прежде сего в таких случаях рекомендуется применять методы решения системы нормальных уравнений т.н. устойчивыми методами.

Как известно, результаты эксперимента записываются в расширенную матрицу наблюдений:

№ опыта	х₁	х₂	...	х_n	y
	f₁₁	f₂₁	...	f_n1
	f₁₂	f₂₂	...	f_n2
:	...	...	...	...
N	f_1N	f_2N	...	f_nN

В этой матрице вместо значений факторов могут стоять базисные функции f_j, если нелинейная зависимость описывается линейной по параметрам моделью. Для получения коэффициентов регрессии МНК матрица наблюдений записывается в виде системы линейных уравнений, которая в матричной форме имеет вид:

(10.1)

где F – матрица регрессоров (7.2);

b – вектор искомых коэффициентов регрессии;

у – вектор откликов:

Произведение транспонированной матрицы регрессоров на ее значение F^TF = Gназывается информационной матрицей МНК. Как уже известно, при наличии мультиколлинеарности решение системы (10.1) обычными методами, в частности, методом Гаусса, является неустойчивым – добавление или изъятие небольшого количества данных приводит к резкому изменению величины коэффициентов регрессии и к большим ошибкам при их оценивании. Менее чувствительными к мультиколлинеарности являются методы треугольного разложения и ортогонального разложения.

При решении системы уравнений МНК методом треугольного разложения обычно применяется один из вариантов этого метода, использующий т.н. разложение Холесского. Этот метод применим только к симметричным положительно определенным матрицам. Исходная информационная матрица G представляется в виде G= L·L^-1, где L – нижняя треугольная матрица (т.е. матрица, у которой по верхнюю сторону от диагонали находятся нули). Например:

После этого задача сводится к решению двух простых систем линейных уравнений:

где С – вспомогательный вектор;

Z – вектор, элементами которого являются суммы произведений:

Метод ортогонального разложения (QR – разложение) не предъявляет к матрице G столь жестких требований. Единственное требование – матрица G должна быть не вырожденной, т.е. ее определитель должен быть отличен от нуля. По этому методу информационная матрица представляется в виде: G = QR, где Q - ортогональная матрица (т.е. состоящая из ортогональных друг другу единичных векторов), а R – верхняя треугольная матрица с неотрицательными диагональными элементами. Например:

Решение системы нормальных уравнений сводится к решению системы:

Разложения Холесского и QR – разложение весьма просто выполняются в MathCAD встроенными специальными функциями. Решение матричных уравнений выполняется специальными программами.

По вычислительной устойчивости на первом месте метод ортогонального разложения, далее идет метод треугольного разложения и на последнем месте – метод Гаусса. Однако при сильной мультиколлинеарности ни один из этих методов не гарантирует получения достаточно точных оценок коэффициентов регрессии. Поэтому разработаны и применяются методы предварительного центрирования переменных и метод регуляризации.

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

ТЕОРИЯ ЭКСПЕРИМЕНТА В ОМД КОНСПЕКТ ЛЕКЦИЙ ПО КУРСУ «ТЕОРИЯ ЭКСПЕРИМЕНТА»

ДОНБАССКИЙ государственный... технический университет... В М ДАНЬКО...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Обработка "плохих" данных

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Планы второго порядка
Если не удается получить приемлемую аппроксимацию экспериментальных данных линейными моделями, то для получения нелинейных по факторам моделей при проведении активных экспериментов используют планы

Центрально-композиционные планы
Если все опыты располагаются симметрично вокруг центра плана (основного уровня), то такие планы называются центральными. Например, план ПФЭ22 (рис.7.2) – симметричен отн

Несимметричные композиционные планы
Несмотря на присущие несимметричным планам недостатки, они представляют практический интерес из-за своей большей экономичности в сравнении с симметричными планами. Несимметричные планы так

Экспериментов
Данные, полученные с помощью любых планов первого порядка, обрабатываются по общей схеме регрессионного анализа. Однако специфика каждого вида плана позволяет находить частные варианты общих соотно

Статистическая обработка экспериментов второго порядка
В принципе производится по той же схеме, что и результатов экспериментов по планам 1-го порядка. Отличие – в способах вычисления оценок коэффициентов регрессии и свободного члена. Оценка п

Регрессионный анализ пассивных экспериментов
х2 Пассивные эксперименты проводятся без всякого плана, поэтому расположение точек в

Мультиколлинеарность и ее причины
В соответствии с 5-й предпосылкой классического РА между столбцами матрицы (9.2) не должно быть линейной или корреляционной зависимости. Если хотя бы один из столбцов может быть выражен в виде лине

Выявление мультиколлинеарности
Для получения качественных результатов РА необходимо выявление мультиколлинеарности в ходе РА или возможности ее появления при подготовке и сборе данных. Внешним признаком мультиколлинеарн

Методы предварительного центрирования независимых переменных и регуляризации
Плохая обусловленность информационной матрицы особенно характерна для полиномиальной регрессии. В этом случае весьма полезным является предварительное центрирование независимых переменных. Суть мет

Регрессионный анализ при наличии ошибок в факторах
Четвертая предпосылка классического РА состоит в том, что факторы Хi эксперимента являются не случайными величинами. Нарушение этой предпосылки является чаще всего встре

В измерении факторов
Известны два подхода к учету ошибок измерения, отличающиеся степенью использования априорной информации об ошибках измерения. Первый подход реализуется в методах инструментальных переменных и в мет