рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Корреляционный анализ

Корреляционный анализ - раздел Философия, ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ ЭКСПЕРИМЕНТА Корреляционный Анализ - Метод, Позволяющий Обнаружить Зависимость Межд...

Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами.

Допустим, проводится независимое измерение различных параметров у одного типа объектов. Из этих данных можно получить качественно новую информацию - о взаимосвязи этих параметров. Для этого вводится коэффициент корреляции. Он рассчитывается следующим образом:

Есть массив из n точек {x1,i, x2,i}

Рассчитываются средние значения для каждого параметра:

И коэффициент корреляции:

r изменяется в пределах от -1 до 1. В данном случае это линейный коэффициент корреляции, он показывает линейную взаимосвязь между x1 и x2: r равен 1 (или -1), если связь линейна.

Коэффициент r является случайной величиной, поскольку вычисляется из случайных величин. Для него можно выдвигать и проверять следующие гипотезы:

1. Коэффициент корреляции значимо отличается от нуля (т.е. есть взаимосвязь между величинами):

Тестовая статистика вычисляется по формуле:

и сравнивается с табличным значением коэффициента Стьюдента t(p = 0.95, f = ) = 1.96

Если тестовая статистика больше табличного значения, то коэффициент значимо отличается от нуля. По формуле видно, что чем больше измерений n, тем лучше (больше тестовая статистика, вероятнее, что коэффициент значимо отличается от нуля)

2. Отличие между двумя коэффициентами корреляции значимо:

Тестовая статистика:

Также сравнивается с табличным значением t(p,)

Свойства коэффициента корреляции:

1. Абсолютная величина выборочного коэффициента корреляции не превосходит единицы.

2. Если выборочный коэффициент корреляции равен нулю и выборочные линии регрессии – прямые, то Х и Y не связаны линейной корреляционной зависимостью.

3. Если величина выборочного коэффициента корреляции равна единице, то наблюдаемые значения признаков связаны линейной корреляционной зависимостью.

4. С возрастанием абсолютной величины выборочного коэффициента корреляции линейная корреляционная зависимость становится более тесной и при ǀrǀ=1 переходит в функциональную зависимость.

В программе Excel для вычисления коэффициента корреляции применяется функции КОРРЕЛ (рис. 26), которая вычисляет коэффициент корреляции между двумя переменными измерений, когда для каждой переменной измерение наблюдается для каждого субъекта N (пропуск наблюдения для субъекта приводит к игнорированию субъекта в анализе). Корреляционный анализ иногда применяется, если для каждого субъекта N есть более двух переменных измерений. В результате выводится таблица, корреляционная матрица, показывающая значение функции КОРРЕЛ для каждой возможной пары переменных измерений.

Рис. 26

 

КОРРЕЛ(массив1;массив2)

Массив1 — это интервал ячеек со значениями.

Массив2 — второй интервал ячеек со значениями.

Если аргумент, который является массивом или ссылкой, содержит текст, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.

Если массив1 и массив2 имеют различное количество точек данных, то функция КОРРЕЛ возвращает значение ошибки #Н/Д.

Если какой-либо из массивов пуст или если σ (стандартное отклонение) их значений равняется нулю, функция КОРРЕЛ возвращает значение ошибки #ДЕЛ/0!.

Уравнение для коэффициента корреляции имеет следующий вид:

где x и y — выборочные средние значения СРЗНАЧ(массив1) и СРЗНАЧ(массив2).

Коэффициент корреляции, как и ковариационный анализ, характеризует степень, в которой два измерения «изменяются вместе». В отличие от ковариационного анализа коэффициент корреляции масштабируется таким образом, что его значение не зависит от единиц, в которых выражены переменные двух измерений (например, если вес и высота являются двумя измерениями, значение коэффициента корреляции не изменится после перевода веса из фунтов в килограммы). Любое значение коэффициента корреляции должно находиться в диапазоне от -1 до +1 включительно.

Корреляционный анализ дает возможность установить, ассоциированы ли наборы данных по величине, т. е. большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция) или наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), или данные двух диапазонов никак не связаны (нулевая корреляция).

 

В программе Excel коэффициент корреляции можно найти с помощью надстройки ПАКЕТ АНАЛИЗА (рис. 27, 28).

Рис. 27

Рис. 28

Входной интервал Введите ссылку на диапазон, содержащий анализируемые данные. Ссылка должна состоять из двух или более смежных диапазонов данных, в которых данные расположены по строкам или столбцам.

Группирование В зависимости от расположения данных во входном диапазоне установите переключатель в положение по строкам или по столбцам.

Метки в первой строке/Метки в первом столбце Если первая строка входного диапазона содержит названия столбцов, установите флажок Метки в первой строке. Если названия строк находятся в первом столбце входного диапазона, установите флажок Метки в первом столбце. Если входной диапазон не содержит меток, снимите этот флажок. Необходимые заголовки в выходной таблице создаются автоматически.

Выходной интервал Введите ссылку на левую верхнюю ячейку выходного диапазона. Поскольку коэффициент корреляции двух наборов данных не зависит от последовательности их обработки, выходная область занимает только половину предназначенного для нее места. Ячейки выходного диапазона, имеющие совпадающие координаты строк и столбцов, содержат значение 1, т. к. каждые строка и столбец во входном диапазоне полностью коррелируют с самим собой.

Новый рабочий лист Установите переключатель в это положение, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1. При необходимости введите имя для нового листа в поле, расположенном напротив соответствующего положения переключателя.

Новая рабочая книга Установите переключатель в это положение для создания новой книги, в которой результаты будут добавлены в новый лист.

Инструменты «Корреляция» и «Ковариация» применяются для одинаковых значений, если в выборке наблюдается N различных переменных измерений. Оба вида анализа возвращают таблицу — матрицу, показывающую коэффициент корреляции или ковариационный анализ соответственно для каждой пары переменных измерений. В отличие от коэффициента корреляции, масштабируемого в диапазоне от -1 до +1 включительно, соответствующие значения ковариационного анализа не масштабируются. Оба вида анализа характеризуют степень, в которой две переменные «изменяются вместе».

Ковариационный анализ вычисляет значение функции КОВАР (рис. 29) для каждой пары переменных измерений (напрямую использовать функцию КОВАР вместо ковариационного анализа имеет смысл при наличии только двух переменных измерений, то есть при N=2). Элемент по диагонали таблицы, возвращаемой после проведения ковариационного анализа в строке i столбец i является ковариационным анализом i-ой переменной измерения с самой собой; это всего лишь дисперсия генеральной совокупности для данной переменной, вычисляемая функцией ДИСПР.

Ковариационный анализ дает возможность установить, ассоциированы ли наборы данных по величине, то есть большие значения из одного набора данных связаны с большими значениями другого набора (положительная ковариация) или наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная ковариация), или данные двух диапазонов никак не связаны (ковариация близка к нулю).

Рис. 29

 

КОВАР(массив1;массив2)

Массив1 — первый массив или интервал данных.

Массив2 — второй массив или интервал данных.

Аргументы должны быть либо числами, либо именами, массивами или ссылками, содержащими числа.

Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.

Если массив1 и массив2 имеют различное число точек данных, функция КОВАР возвращает значение ошибки #Н/Д.

Если массив1 или массив2 пуст, функция КОВАР возвращает значение ошибки #ДЕЛ/0!.

Ковариация определяется следующим образом:

Входной интервал Введите ссылку на диапазон, содержащий анализируемые данные. Ссылка должна состоять из двух или более смежных диапазонов данных, в которых данные расположены по строкам или столбцам.

Группирование В зависимости от расположения данных во входном диапазоне установите переключатель в положение по строкам или по столбцам.

Метки в первой строке/Метки в первом столбце Если первая строка входного диапазона содержит названия столбцов, установите флажок Метки в первой строке. Если названия строк находятся в первом столбце входного диапазона, установите флажок Метки в первом столбце. Если входной диапазон не содержит меток, снимите этот флажок. Необходимые заголовки в выходной таблице создаются автоматически.

Выходной интервал Введите ссылку на левую верхнюю ячейку выходного диапазона. Поскольку ковариация двух наборов данных не зависит от последовательности их обработки, то выходная область занимает только половину предназначенного для нее места. Диагональные ячейки выходной области содержат значения дисперсий входных диапазонов.

Новый рабочий лист Установите переключатель в это положение, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1. При необходимости введите имя для нового листа в поле, расположенном напротив соответствующего положения переключателя.

Новая рабочая книга Установите переключатель в это положение для создания новой книги, в которой результаты будут добавлены в новый лист.

 

– Конец работы –

Эта тема принадлежит разделу:

ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ ЭКСПЕРИМЕНТА

Государственное образовательное учреждение... Высшего профессионального образования... МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕКСТИЛЬНЫЙ...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Корреляционный анализ

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Определение фактора
Фактором называется измеряемая переменная ве­личина, принимающая в некоторый момент времени определенное значение. Факторы соответствуют способам воз­действия на объект исследования. Также

Требования, предъявляемые к факторам при планировании эксперимента
При планировании эксперимента факторы должны быть управляемыми. Это значит, что экспери­ментатор, выбрав нужное значение фактора, может его поддерживать постоянным в течение всего опыта, т. е. може

Требования к совокупности факторов
При планировании эксперимента обычно одно­временно изменяется несколько факторов. Поэтому очень важно сформулировать требования, которые предъяв­ляются к совокупности факторов. Прежде всего, выдви­

Представление результатов экспериментов
  Геометрическое представление функции отклика в факторном пространстве Х1, Х2, …, Хn называется поверхностью отклика (рис. 2).

Факторов
  Если заранее не известно аналитическое выражение функции отклика, то можно рассматривать не саму функцию, а ее разложение, например в степенной ряд в виде полинома

Однофакторный факторный эксперимент
В однофакторном планировании влияние входных параметров (факторов) на выходной параметр изучается постепенно, причем в серии опытов меняется уровень лишь одного фактора, а остальные остаются

Регрессионный анализ
В регрессионном анализе изучается связь и определяется количественная зависимость между зависимой переменной и одной или несколькими независимыми переменными. При решении многих инженерных

Метод наименьших квадратов
Метод наименьших квадратов — один из методов регрессионного анализа для оценки неизвестных величин по результатам измерений, содержащим случайные ошибки. Метод наименьших квадратов применя

Регрессионные модели первого и второго порядка
Уравнением регрессии Y от X называют функциональную зависимость у=f(x), а ее график – линией регрессии. При обработке экспериментальных данных одной из важных задач является задача определ

Построение графиков
Excel позволяет создавать диаграммы и графики довольно приемлемого качества. Excel имеется специальное средство — Мастер диаграмм, под руководством которого пользователь проходит все четыре этапа п

Построение линий тренда
Для получения математической модели необходимо построить на графике линию тренда. В Excel 2003 и 2007 нужно щелкнуть правой кнопкой мыши на точки графика. Тогда в Excel 2003 появится вкладка с пере

Линейная функция
Функция аргумента х, имеющая вид у=ах+b, где а и b – некоторые заданные числа, называется линейной. Ее графиком является прямая линия, которая наклонена к оси х п

Логарифмическая, степенная и экспоненциальная функции
  Экспоненциальная функция y=a.ebx где a и b – расчетные коэффициенты, e – основание натурального логарифм

Полиномиальная функция
  Полиномиальная функция 2 порядка у=а1.х2+а2.х+а3 где а1, а2, а

Проверка адекватности модели
Для проверки гипотезы адекватности модели необходимо сравнить две суммы квадратов: 1) Остаточную сумму квадратов, характеризующую отклонение от регрессии

Проверка значимости параметров модели и ее адекватности
  В результате проверки устанавливается статистическая значимость или незначимость отличия от нуля оценок параметров регрессии. Это проверка осуществляется отдельно для каждого параме

Некоторые нелинейные модели, сводящиеся к линейным
Основной задачей при определении вида математической модели исследуемого процесса является наиболее точное отображение общей тенденции зависимости Y от X. Общий вид математической мод

Полиномиальная модель
Для определения степени полинома используют метод тождественности разделенных или неразделенных разностей. Если в результате эксперимента получены следующие пары значений

Множественная линейная регрессия
Множественная регрессия – уравнение связи с несколькими независимыми переменными:

Регрессия в программе Excel
  Статистическая обработка данных может также проводиться с помощью надстройки Пакет анализа в подпункте меню «Сервис». В программе Excel 2003, если открыв СЕРВИС, не находим в

Полный факторный эксперимент
Эффективное решение научных и прикладных задач исследований различных процессов и явлений предполагает учет, по возможности, всей совокупности факторов и их взаимных связей, оказывающих влияние на

Планирование ПФЭ.
Перед началом эксперимента необходимо построить его план, т.е. определить, какие сочетания уровней факторов следует реализовать и в каком порядке осуществить планирование и рандомизацию повторных о

Выбор факторов
При выборе факторов нужно выполнять сле­дующие требования: 1) фактор должен быть регулируемым, т. е. с помощью опреде­ленного регулирующего устройства фактор можно изменять от зна­чения x1

Эксперимента
  При матричной записи результатов различных N опытов для полиномиального представления результата

Ортогональное планирование эксперимента
  Структура матрицы С играет важную роль в реализации алгоритма определения коэффициентов аппроксимирующего полинома. Структура матрицы С зависит от

Планы второго порядка
  Они позволяют сформировать функцию отклика в виде полного квадратичного полинома, который содержит большее число членов, чем неполный квадратичный полином, сформированный по планам

Второго порядка
  Ортогональным планом называется такой план, у которого матрица планирования Х строится так, что бы матрица С=ХtХ оказалась диагональной.

Планы второго порядка с единичной областью планирования
  Так как ОЦКП и РОЦКП - композиционные планы, то при естественной области планирования “звездные” точки могут выходить за пределы единичного гиперкуба и единичного гипершара. Для впи

Рототабельные планы
  Рототабельные планы – это планы, у которых точки плана располагаются на окружностях (сферах, гиперсферах). У рототабельного плана первого порядка точки плана располагаются на одной

Рототабельный ортогональный центрально-композиционный план
  Рототабельный ортогональный центрально-композиционный план (РОЦКП) строится аналогично рассмотренному ранее ОЦКП. К использованному в качестве ядра плану ПФЭ 2n добавляют

Рототабельный план на основе правильного многоугольника при n=2
  U x0 x1 x2 x3=x1x2 x

Композиционные планы
Применение линейных планов совместно с методом градиентного поиска оптимума позволяет достичь окрестностей точки оптимума. Поиск оптимального решения в этой области требует перехода от линейных мод

Планы для экспериментирования в условиях дрейфа
Блочные планы, ортогональные к дискретному дрейфу, пред­ставляют собой обычные планы типа ПМА, сбалансированные так, чтобы часть столбцов плана использовалась для оценки эффектов дискретного дрейфа

Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам различного объема. Критерий Бартлетта.
Н0: D(X1)=D(X2) =D(X3)=… =D(Xl) Введем обозначения ki=ni-1 – число степеней свободы дисперсии S2

Дисперсионный анализ
При исследовании однотипных величин возникают задачи их сравнения. Сравнение случайных величин производится путем сопоставления законов распределения или их моментов. Законы распределения

Однофакторный дисперсионный анализ
Это средство служит для анализа дисперсии по данным двух или нескольких выборок. При анализе гипотеза о том, что каждый пример извлечен из одного и того же базового распределения вероятности, сравн

Проверка значимости оценок коэффициентов модели
Проверка значимости оценок коэффициентов полинома производится на основе проверки статистической гипотезы о равенстве математического ожидания случайной величины нулю, т.е. проверки условия b

Проверка адекватности модели
  Проверка адекватности математической модели данным эксперимента проводится только в случае ненасыщенного планирования на основе сопоставления дисперсии воспроизводимости среднего зн

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги