Принцип оптимальности.

Впервые был сформулирован Р. Беллманом в 1953 году.

Каково бы не было состояние системы в результате какого-либо числа шагов на ближайшем шаге нужно выбрать управление так, чтобы оно приводило к оптимальному выигрышу на всех оставшихся шагах.

Основное требование: процесс управления должен быть без обратной связи, то есть управление на данном шаге не должно оказывать влияние на предшествующие шаги.

В динамическом программировании процесс нахождения оптимального решения разворачивается от конца к началу: сначала планируется последний n-ый шаг, для этого делают предположение про (n-1)-ый шаг. Для этого предположения выбирают условное оптимальное управление на последнем шаге. Затем вычисляют условное оптимальное управление и условие оптимальное значение целевой функции. Этот процесс повторяется на каждом шаге от последнего к первому шагу. Далее строится искомое безусловное оптимальное управление процессом и находится значение целевой функции за всю операцию. Таким образом, многошаговый процесс проходят дважды:

1) от конца к началу – условное решение;

2) от начала к концу – безусловное решение;