рефераты конспекты курсовые дипломные лекции шпоры

Раздел Науковедение
/
Вид работы: Лекции
/
Постановка задачи динамического программирования.

Реферат Курсовая Конспект

Выберите учебное заведение

Постановка задачи динамического программирования.

Постановка задачи динамического программирования. - Лекция, раздел Науковедение, Курс лекций по дисциплине: МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ Рассматривается Управляемый Процесс. В Результате Управления Система (Объект ...

Рассматривается управляемый процесс. В результате управления система (объект управления) приводится из начального состояния S₀ в конечное S(S₀→ S). Предположим, что управление можно разбить на n шагов, то есть решение принимаются последовательно на каждом шаге, а управление представляет собой совокупность n пошаговых управлений. Обозначим через X_k управление на k – ом шаге, k = 1,2,3…,n; X_k может быть числом, точкой в n-мерном пространстве или качественным признаком. Пусть X(X₁, X₂,..., X_n) – это управление, приводящее систему из S₀ в S. Обозначим через S_k состояние системы после k-го шага управления. Получаем последовательность состояний:

S₀, S₁, S₂,…, S_k_-1, S_k,... S_n_-1, S_n; которую изобразим кружками.

Показатель эффективности операции, целевая функция зависит от начального состояния S₀ и управления X

Z=f(S₀,x) (3.1)

Предположим:

1) Состояние системы S_k в конце k-го шага зависит от предшествующего состояния S_k_-1и управления на k-ом шаге X_k. Это требование называется отсутствием последствия:

Это положение записывают в виде уравнений

S_k = ϥ_k(S₀,x_k) k=1,2,3...n (3.2)

Которые называются уравнениями состояния.

2) Обозначим показатель эффективности k-го шага через

Z_k=f_k(S_k_-1,x_k) k=1,2,3...n (3.3)

тогда

Z=∑ⁿ_k₌₁ а(S_k_-1, x_k) (3.4)

Задача динамического программирования (пошаговой оптимизации) формируется так: определить такое управление X, переводящее систему S из состояния S₀ в состояние S, при котором целевая функция (3,4) принимает наибольшее (наименьшее) значение.

Особенности модели динамического программирования:

1) Задача оптимизации интерпретируется как n-шаговый процесс управления;

2) Целевая функция равна сумме целевых функций каждого шага;

3) Выбор управления на k- ом шаге зависит только от состояния системы к этому шагу и не влияет на предшествующие шаги (нет обратной связи);

4) Состояние S_k после k-ого шага управления зависит только от предшествующего состояния S_k_-1и управления x_k (отсутствия последствий).

5) На каждом шаге управления x_k зависит от конечного числа управляющих переменных, а состояние S_k от конечного числа параметров.

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

Курс лекций по дисциплине: МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ... МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ... Курс лекций по дисциплине...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Постановка задачи динамического программирования.

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Экономико-математическая модель. ТЗ
Транспортные задачи(ТЗ)- частный случай задачи линейного программирования. В ТЗ существуют поставщики и потребители грузов. У каждого поставщика имеется определенное количест

Метод северо-западного угла.
С помощью метода северо-западного угла реализуется первоначальный план поставок. Таблица 2.1 Nj M

Метод потенциалов нахождения оптимального решения.
Введем показатель U1 для каждой строки и V1 для каждого столбца. Эти показатели называются потенциалами поставщиков и потребителей. Потенциалы подбираются так, чтобы для запол

Открытая (не сбалансированная) модель ТЗ.
Открытая модель сводится к закрытой. Если суммарная мощность поставщика больше суммарного спроса потребителей, то вводится фиктивный потребитель, к которому присваивается спрос равный разнице между

Принцип оптимальности.
Впервые был сформулирован Р. Беллманом в 1953 году. Каково бы не было состояние системы в результате какого-либо числа шагов на ближайшем шаге нужно выбрать управление так, чтобы оно приво

Задачи замены оборудования без приведения затрат к текущему моменту времени.
1) Постановка задачи: В эксплуатации находятся оборудование, цена нового оборудования S. Известны затраты на эксплуатацию оборудования С t зависящие от времени. В результ

Задачи замены оборудования с учетом приведения затрат к текущему моменту времени.
1) Постановка задачи: В эксплуатация находится с первоначальной ценой S. Известны затраты на эксплуатацию оборудования в периоды 1, 2, 3 . . . t - С1, С

Детерминированные задачи упорядочивания.
1) Постановка задачи: Имеется несколько изделий, каждое из которых надо обработать на двух машинах последовательно (сначала на первой, потом на второй). Известны вре

Решение игры с седловой точкой.
B1 B2 А1 -4 А2

Смешанные стратегии.
Рассмотрим пример; В1 В2 min А1

Дублирование и доминирование стратегий.
Если матрица игры содержит несколько одинаковых строк или стобцов, то из них оставляют одну строку(столбец), а отброшенным стратегиям присваиваем нулевые вероятности. Это дублирование с

Решение игры 2хn.
Самым удобным способом для определения оптимальной стратегии игроков в игре 2хn является графическим способом. Пример:

Марковские процессы.
Для математического описания многих случайных процессов может быть применен аппарат, разработанный в теории вероятностей, для так называемых Марковских случайных процессов. Они обладают следующим с

Простейший пуассоновский поток событий.
Для простейшего потока справедливы три свойства: 1) Стационарность потока λ = const. Интенсивность λ – частота появления события или среднее число событий, поступающих в СМО в ед

Система дифференциальных уравнений Колмогорова.
Рассмотрим математическое описание процесса с дискретными состояниями системы и непрерывным временем на примере случайного процесса, размеченный граф которого размещен на рисунке:

Уравнение Колмогорова для простейшего потока событий.
Особый интерес представляют вероятности системы Рi(t) в предельном стационарном режиме, т.е. при t→∞, которые называются предельными вероятностями состояний. Т.к. пр

Системы массового обслуживания с отказом.
В качестве показателей эффективности СМО с отказами будет рассматривать: А – абсолютную пропускную способность СМО, т.е. среднее число заявок, обслуживаемых системой в единицу времени;

Системы массового обслуживания с ожиданием
В качестве показателей эффективности СМО с ожиданием, кроме уже известных показателей – абсолютной А и относительной Q пропускной способности, вероятности отказа ρотк, среднего числ