Определение оптимального плана замены оборудования
оптимальной стратегии управления U=(u1, u2, …, un), а через Fn-k(X(k)) максимальный доход, получаемый при переходе из любого состояния X(k) в конечное состояние X(n) при оптимальной стратегии управления на оставшихся n-k шагах. Тогда:
Fn(X0)=max[W1(X(0), u1)+…+ Wn(X(n-1), un)]; (2.2)
Uk+j
Fn-k(X(k))=max[Wk+1(X(k), uk+1)+Fn-k-1(Xk+1))](k=0, n-1). (2.3)
Uk+1
Последнее выражение представляет собой математическую запись принципа оптимальности и носит название основного функционального уравнения Беллмана или рекуррентного соотношения. Используя данное уравнение можно найти решение задачи динамического программирования.
Полагая k=n-1 в рекуррентном соотношении (2.3) , получим следующее функциональное уравнение:
F1(X(n-1)=max[Wn(X(n-1), un)+F0(X(n))]. (2.4)
un
В этом уравнении F0(X(n)) будем считать известным. Используя теперь уравнение (1.4) и рассматривая всевозможные допустимые состояния системы S на (n-1)-м шаге X1(n-1), X2(n-1), …, Xm(n-1), …, находим условные оптимальные решения
un0(x1(n-1)), un0(x2(n-1)),…, un0(xm(n-1)),…
и соответствующие значения функции (2.4)
F10 (X1(n-1)), F10 (X2(n-1)), …, F10 (Xm(n-1)),… .
Таким образом, на n-м шаге находим условно оптимальное управление при любом допустимом состоянии системы S после (n-1)-го шага. То есть, в каком бы состоянии система ни оказалась после (n-1)-го шага, будет известно, какое следует принять решение на n-м шаге. Известно также и соответствующее значение функции (2.4). Рассмотрим функциональное уравнение при k=n-2:
F2(X(n-1))=max[Wn-1(X(n-2), un-1)+F1(X(n-1))]. (2.5)
Un-1
Для того чтобы найти значения F2 для всех допустимых значений X(n-2), необходимо знать Wn-1(X(n-2), un-1) и F1(X(n-1)). Что касается значений F1(X(n-1)), то они уже определены.Поэтому нужно произвести вычисления для Wn-1(X(n-2), un-1) при некотором отборе допустимых значений X(n-2) и соответствующих управлений un-1 . Эти вычисления позволят определить условно оптимальное управление u0n-1 для каждого X(n-2) . Каждое из таких управлений совместно с уже выбранным управлением на последнем шаге обеспечивает максимальное значение дохода на двух последних шагах.
Последовательно осуществляя описанный выше итерационный процесс, дойдем до первого шага. На этом шаге известно, в каком состоянии может находиться система. Поэтому уже не требуется делать предположений о допустимых состояниях системы, а остается лишь только выбрать управление, которое является наилучшим с учетом условно оптимальных управлений, уже принятых на всех последующих шагах.
Таким образом, в результате последовательного прохождения всех этапов от конца к началу определяется максимальное значение выигрыша за n шагов и для каждого из них находим условно оптимальное управление.
Чтобы найти оптимальную стратегию управления, то есть определить искомое решение задачи, нужно теперь пройти всю последовательность шагов, только на этот раз от начала к концу. А именно: на первом шаге в качестве оптимального управления u1* возьмем найденное условно оптимальное управление u10. На втором шаге найдем состояние X1* , в которое переводит систему управление u1*. Это состояние определяет найденное условно оптимальное u20 , которое теперь считается оптимальным. Зная u2*, находим X2*, а значит, определяем u3* и т.д. В результате этого найдется решение задачи, то есть максимально возможный доход и оптимальную стратегию управления U*, включающую оптимальные управления на отдельных шагах: U*= (u1*, u2*, …, un*).
Итак, из нахождения решения задачи динамического программирования видно, что этот процесс является довольно громоздким. Поэтому более сложные задачи решают с помощью ЭВМ. [1].
Динамическую задачу по замене оборудования возможно также решить и графическим методом. На оси Х откладывают номер шага (к). на оси У возраст оборудования (t). Точка (к-1;t) на плоскости соответствует началу К-ого шага по эксплуатации оборудования в возрасте t лет.
Любая траектория переводящая точку S(k-1;t) из состояния S0 S, . Состоит из отрезков, то есть из шагов соответствующих годам эксплуатации. Нужно выбрать такую траекторию при которой затраты на эксплуатацию будут минимальны. Если известны зависимость производительности установленного на предприятии оборудования от времени его использования R(t) и зависимость затрат на ремонт оборудования при различном времени его использования S(t) и затраты связанные с приобретением нового оборудования, то показателем эффективности в этом случае является прибыль которая максимизируется.
3. РАСЧЕТ ПОКАЗАТЕЛЕЙ ЭКОНОМИКО-МАТЕМАТИЧЕСКОЙ МОДЕЛИ И ЭКОНОМИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ
В этой задаче в качестве системы S выступает оборудование. Состояние этой системы определяются фактическим временем использования оборудования (его возрастом) t, то есть описываются единственным параметром t.
В качестве управлений выступают решения о замене и сохранении оборудования, принимаемые в начале каждого года. Обозначим через Xc решение о сохранении оборудования, а через Xз решение о замене оборудования. Тогда задача состоит в нахождении такой стратегии управления, определяемой решениями, принимаемыми к началу каждого года, при которой общая прибыль предприятия за восемь лет является максимальной.
Эта задача обладает свойствами аддитивности и отсутствия последействия. Следовательно, ее решение можно найти с помощью алгоритма, реализуемого в два этапа. На первом этапе при движении от начала 10-го года периода к началу 1-го года для каждого допустимого состояния оборудования найдем условное оптимальное управление (решение), а на втором этапе при движении от начала 1-го года периода к началу 10-года из условных оптимальных решений для каждого года составим оптимальный план замены оборудования на десять лет.
Для определения условных оптимальных решений сначала необходимо составить функциональное уравнение Беллмана. Так как было предположено, что к началу k-го года (k=1,2,3,4,5,6,7,8,9,10) может приниматься только одно из двух решений заменять или не заменять оборудование, то прибыль предприятия за k-ый год составит:
Z*k = max r(t)-s(t)+Zk+1(t+1) ; Xc
r(0)-s(0)-P0+Zk+1(1) ; Xз (3.1)
где t возраст оборудования к началу k-го года (k=1,2,3,4,5,6,7,8,9,10); Xk управление, реализуемое к началу k-го года; P0 стоимость нового оборудования.
Используя теперь уравнение (3.1) , находим решение исходной задачи. Это решение начинается с определения условно оптимального управления (решения) для последнего (10-го) года периода, в связи с чем находим множество допустимых состояний оборудования к началу данного года. Так как к началу периода имеется новое оборудование (t =0), то возраст оборудования к началу 10-го года может составлять 1,2,3,4,5,6,7,8,9 лет. Для каждого из этих состояний найдем условно оптимальное решение и соответствующее значение функции Z*10(t).
Z*10(1)=max 8,99 = 8,99; Xc
-0,07
Z*10(2)=max 8,06 = 8,06; Xc
-0,07
Z*10(3)=max 6,89 = 6,89; Xc
-0,07
скачать реферат
1 2 3 4 5 6