рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Назначение, особенности, области применения методов интеллектуального анализа данных.

Назначение, особенности, области применения методов интеллектуального анализа данных. - раздел Философия, Методологическая классификация автоматизированных информационных систем, направлений и методологий их исследования Интеллектуальный Анализ Данных (Англ. Data Mining) — Это Процесс Обнаружения ...

Интеллектуальный анализ данных (англ. Data Mining) — это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности [1] . Подразделяется на задачи классификации, моделирования и прогнозирования и другие. Методы Data Mining разделяются на статистические (дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов) и кибернетические (искусственные нейронные сети, эволюционное программирование, генетические алгоритмы, ассоциативная память, нечеткая логика, деревья решений, системы обработки экспертных знаний).

Визуальные инструменты Data Mining позволяют проводить анализ данных предметными специалистами (аналитиками), не владеющими соответствующими математическими знаниями.

Задачи, решаемые Data Mining

· Классификация — отнесение входного вектора (объекта, события, наблюдения) к одному из заранее известных классов.

· Кластеризация — разделение множества входных векторов на группы (кластеры) по степени «похожести» друг на друга.

· Сокращение описания — для визуализации данных, лаконизма моделей, упрощения счета и интерпретации, сжатия объемов собираемой и хранимой информации.

· Ассоциация — поиск повторяющихся образцов. Например, поиск «устойчивых связей в корзине покупателя» (англ. market basket analysis) — вместе с пивом часто покупают орешки.

· Прогнозирование

· Анализ отклонений — Например, выявление нетипичной сетевой активности позволяет обнаружить вредоносные программы.

· Визуализация

В литературе можно встретить еще ряд классов задач. Базовыми задачами являются первые три. Остальные задачи сводятся к ним тем или иным способом.

Также можно использовать сводные задачи под основу

Этапы обучения

Можно выделить типичный ряд этапов решения задач методами Data Mining:

1. Формирование гипотезы;

2. Сбор данных;

3. Подготовка данных (фильтрация);

4. Выбор модели;

5. Подбор параметров модели и алгоритма обучения;

6. Обучение модели (автоматический поиск остальных параметров модели);

7. Анализ качества обучения, если неудовлетворительный переход на п. 5 или п. 4;

8. Анализ выявленных закономерностей, если неудовлетворительный переход на п. 1, 4 или 5.

Gregory Piatetsky-Shapiro Это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей.

Стадии Data Mining.

СВОБОДНЫЙ ПОИСК (в том числе ВАЛИДАЦИЯ)

ПРОГНОСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

АНАЛИЗ ИСКЛЮЧЕНИЙ.

Технологические методы.

Непосредственное использование данных, или сохранение данных: кластерный анализ, метод ближайшего соседа, метод k-ближайшего соседа, рассуждение по аналогии (этот метод будет рассмотрен подробнее) Выявление и использование формализованных закономерностей, или дистилляция шаблонов: логические методы; методы визуализации; методы кросс-табуляции; методы, основанные на уравнениях.

Статистические методы.

Дескриптивный анализ и описание исходных данных. Анализ связей (корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ). Многомерный статистический анализ (компонентный анализ, дискриминантный анализ, многомерный регрессионный анализ, канонические корреляции и др.). Анализ временных рядов (динамические модели и прогнозирование).

Кибернетические методы.

Искусственные нейронные сети (распознавание, кластеризация, прогноз); Эволюционное программирование (в т.ч. алгоритмы метода группового учета аргументов); Генетические алгоритмы (оптимизация); Ассоциативная память (поиск аналогов, прототипов); Нечеткая логика; Деревья решений; этот метод будет рассмотрен подробнее. Системы обработки экспертных знаний.

Области применения Data mining.

Database marketers - Рыночная сегментация, идентификация целевых групп, построение профиля клиента Банковское дело - Анализ кредитных рисков, привлечение и удержание клиентов, управление ресурсами Кредитные компании - Детекция подлогов, формирование "типичного поведения" обладателя кредитки, анализ достоверности клиентских счетов , cross-selling программы Страховые компании - Привлечение и удержание клиентов, прогнозирование фингансовых показателей Розничная торговля - Анализ деятельности торговых точек, построение профиля покупателя, управление ресурсами Биржевые трейдеры - Выработка оптимальной торговой стратегии, контроль рисков.

Телекоммуникация и энергетика - Привлечение клиентов, ценовая политика, анализ отказов, предсказание пиковых нагрузок, прогнозирование поступления средств Налоговые службы и аудиторы - Детекция подлогов, прогнозирование поступлений в бюджет Фармацевтические компании - Предсказание результатов будущего тестирования препаратов, программы испытания Медицина - Диагностика, выбор лечебных воздействий, прогнозирование исхода хирургического вмешательства Управление производством - Контроль качества, материально-техническое обеспечение, оптимизация технологического процесса Ученые и инженеры - Построение эмпирических моделей, основанных на анализе данных, решение научно-технических задач.

http://900igr.net/prezentatsii/informatika/Data-Mining/009-Metody-Data-Mining.html

 

8. Количественный анализ интерфейсов методом GOMS - «правила для целей, объектов, методов и выделения» (the model of goals, objects, methods and selection rules).

– Конец работы –

Эта тема принадлежит разделу:

Методологическая классификация автоматизированных информационных систем, направлений и методологий их исследования

Рыночные отношения и конкурентная борьба производителей диктуют свои правила организации производства в том числе постоянно расширяющуюся сферу... Отечественный и зарубежный опыт показывает что большой потенциал повышения... CASE технологии Computer Aided Software Engineering которые представляют собой методологию проектирования язык...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Назначение, особенности, области применения методов интеллектуального анализа данных.

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Системная методология; система, заданная на объекте.
Методология разработки программных систем - учение о структуре, логической организации, методах, средствах моделирования, поиска и принятия решений о принципе действия и составе еще не сущес

Блок-схемы
Схемы передач управления. Для изображения передач управления в программном модуле обычно используются структурные схемы программ. На рисунке 3.8 показаны стандартные и нес

Схемы Насси-Шнейдермана
Схемы Насси-Шнейдермана. Способ изображения модуля с помощью схем Насси-Шнейдермана представляет собой попытку использования требований структурного программирования (см. ниже) в с

Таблицы решений
Таблицы решений. Метод проектирования с помощью таблиц решений заключается в перечислении вариантов управляющих решений, принимаемых на основе анализа данных. Поскольку в этих табл

Элементы аналитической теории алгоритмов.
Алгоритм — точный набор инструкций, описывающих порядок действий, ведущих от исходных данных к искомому результату для решения конкретной задачи за конечное время. Свойств

Инженерная психология
Недооценка человеческого фактора нередко приводит, к возникновению разного рода психологических барьеров, мешающих освоению новой технологии и новых организационных структур, что в конечном итоге о

Рекомендации при построении информационных моделей.
Выделим ряд общих требований, рекомендуемых при построении информационной модели: · Информационная модель должна представлять лишь существенные свойства, отношения, связи, взаимодействия у

Методы оценки качества визуального интерфейса.
Рассмотрим количественные методы оценки проектирования интерфейса [75,79,96]. Важной прерогативой этих методов перед эмпирическими методами является то, что они позволяют раскрыть и формально зафик

Расчеты по модели GOMS
Вычисления времени, необходимого на выполнение того или иного действия (например, «переместить руку с графического устройства ввода на клавиатуру и набрать букву»), с помощью модели GOMS начинаются

Задачи и методы теории распознавания образов.
Теория распознавания образов — раздел кибернетики, развивающий теоретические основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которы

Методы распознавания образов
Для оптического распознавания образов можно применить метод перебора вида объекта под различными углами, масштабами, смещениями и т. д. Для букв нужно перебирать шрифт, свойства шрифта и т. д.

Каскадная, итерационная и спиральная гносеологические модели процесса проектирования ИС.
1. Каскадный (Пк) - предполагает переход на следующий этап после полного окончания работ по предыдущему этапу. Идея – непогрешимость выработанных методи

ISO (International Standart Organization), система сертификации качества.
ISO 9000 — серия международных стандартов, описывающих требования к системе менеджмента качества организаций и предприятий. Важно понимать, что соответствие стандар

Принципы моделирования
Использование языка UML основывается на следующих общих принципах моделирования: абстрагирование - в модель следует включать только те элементы проектируемой системы, которые имеют

Государственные стандарты по разработке автоматизированных систем.
1. ОБЩИЕ ПОЛОЖЕНИЯ   1.1. Создание (развитие) АС представляет собой совокупность упорядоченных во времени, взаимно связанных, объединенных в стадии и этапы работ, выполнение

SADT-технология структурного анализа и проектирования
SADT (Structured Analysis and Design Technique) методология анализа и проектирования систем. С точки зрения SADT модель может основываться либо на функциях системы, либо на ее предметах (п

Генетические алгоритмы.
Генетический алгоритм (англ. genetic algorithm) — это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путём случайного подбора, комбинирования и вариации и

Прочие стандарты
Схемы алгоритмов, программ, данных и систем. Условные обозначения и правила выполнения.   27. Надежность и качество функционирования АИС: Определение «наде

Стратегия проектирования, ориентированная на структуру данных.
внимание концентрируется прежде всего на структуре данных, в соответствии с которой строится структура управляющей логики. Такой подход может быть назван ориентированным на структуру данных или на

Теория информации Шеннона.
Точнее количества информации, исходит из элементарного альтернативного выбора между двумя знаками (битами) 0 и 1. Такой выбор соответствует приёму сообщения, состоящего из одного двоичного з

Научное мировоззрение, инженерный подход.
Понятии «научно» обоснованная технология, т.е. на тех видах знания, которые можно формально описать и использовать как научно обоснованную организацию производственного процесса, в основе которой л

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги