Метод динамического программирования

Динамическое программирование — один из разделов оп­тимального программирования, в котором процесс принятия решения и управления может быть разбит на отдельные эта­пы (шаги).

Экономический процесс является управляемым, если мож­но влиять на ход его развития. Под управлением понимает­ся совокупность решений, принимаемых на каждом этапе для влияния на ход развития процесса. Например, выпуск продук­ции предприятием — управляемый процесс. Совокупность ре­шений, принимаемых в начале года (квартала и т.д.) по обеспе­чению предприятия сырьем, замене оборудования, финансиро­ванию и т.д., является управлением. Необходимо организовать выпуск продукции так, чтобы принятые решения на отдель­ных этапах способствовали получению максимально возмож­ного объема продукции или прибыли.

Динамическое программирование позволяет свести одну сложную задачу со многими переменными ко многим задачам с малым числом переменных. Это значительно сокращает объ­ем вычислений и ускоряет процесс принятия управленческого решения.

В отличие от линейного программирования, в котором сим­плексный метод является универсальным методом решения, в динамическом программировании такого универсального ме­тода не существует. Одним из основных методов динамичес­кого программирования является метод рекуррентных соотношений, который основывается на использовании принципа оптимальности, pазработанного американским математиком Р. Беллманом. Принцип состоит в том, что, каковы бы ни бы­ли начальное состояние на любом шаге и управление, выбран­ное на этом шаге, последующие управления должны выбирать­ся оптимальными относительно состояния, к которому придет система в конце данного шага. Использование данного прин­ципа гарантирует, что управление, выбранное на любом шаге, не локально лучше, а лучше с точки зрения процесса в целом.

В некоторых задачах, решаемых методом динамического программирования, процесс управления разбивается на шаги. При распределении на несколько лет ресурсов деятельности предприятия шагом целесообразно считать временной пери­од; при распределении средств между предприятиями — номер очередного предприятия. В других задачах разбиение на шаги вводится искусственно. Например, непрерывный управляемый процесс можно рассматривать как дискретный, условно разбив его на временные отрезки (шаги). Исходя из условий каждой конкретной задачи, длину шага выбирают таким образом, что­бы на каждом шаге получить простую задачу оптимизации и обеспечить требуемую точность вычислений.

Оптимальная стратегия замены оборудования

 

Одной из важных экономических проблем является опреде­ление оптимальной стратегии в замене старых станков, агре­гатов, машин на новые.

Старение оборудования включает его физический и мораль­ный износ, в результате чего растут производственные затра­ты по выпуску продукции на старом оборудовании, увеличива­ются затраты на его ремонт и обслуживание, снижаются про­изводительность и ликвидная стоимость.

Наступает время, когда старое оборудование выгоднее про­дать, заменить новым, чем эксплуатировать ценой больших за­трат; причем его можно заменить новым оборудованием того же вида или новым, более совершенным.

Оптимальная стратегия замены оборудования состоит в определении оптимальных сроков замены. Критерием опти­мальности при этом может служить прибыль от эксплуата­ции оборудования, которую следует оптимизировать, или сум­марные затраты на эксплуатацию в течение рассматриваемого промежутка времени, подлежащие минимизации.

Введем обозначения: r(t) — стоимость продукции, произ­водимой за один год на единице оборудования возраста t лет;

u(t) — ежегодные затраты на обслуживание оборудования возраста t лет;

s(t) — остаточная стоимость оборудования возраста t лет;

Р — покупная цена оборудования.

Рассмотрим период N лет, в пределах которого требуется определить оптимальный цикл замены оборудования.

Обозначим через fN(t) максимальный доход, получаемый от оборудования возраста t лет за оставшиеся N лет цикла использования оборудования при условии оптимальной стра­тегии.

Возраст оборудования отсчитывается в направлении тече­ния процесса. Так, t = 0 соответствует случаю использования нового оборудования. Временные же стадии процесса нумеру­ются в обратном направлении по отношению к ходу процесса. Так, N = 1 относится к одной временной стадии, остающей­ся до завершения процесса, а N = N — к началу процесса (рис. 29.1).

На каждом этапе N-стадийного процесса должно быть при­нято решение о сохранении или замене оборудования. Выбран­ный вариант должен обеспечивать получение максимальной прибыли.

Функциональные уравнения, основанные на принципе оп­тимальности, имеют вид:

  

Уравнение (29.1) описывает N-стадийный процесс, а (29.2) — одностадийный. Оба уравнения состоят из двух час­тей: верхняя строка определяет доход, получаемый при сохра­нении оборудования; нижняя — доход, получаемый при замене оборудования и продолжении процесса работы на новом обору­довании.

В уравнении (29.1) функция r(t) — u(t) есть разность между стоимостью произведенной продукции и эксплуатационными издержками на N-й стадии процесса.

Функция fN-1 (t + 1) характеризует суммарную прибыль от (N 1) оставшихся стадий для оборудования, возраст которо­го в начале осуществления этих стадий составляет (t + 1) лет.

Нижняя строка (29.1) характеризуется следующим обра­зом: функция s(t) — Р представляет чистые издержки по замене оборудования, возраст которого t лет.

Функция r(0) выражает доход, получаемый от нового обо­рудования возраста 0 лет. Предполагается, что переход от ра­боты на оборудовании возраста t лет к работе на новом обо­рудовании совершается мгновенно, т.е. период замены старо­го оборудования и переход на работу на новом оборудовании укладываются в одну и ту же стадию.

Последняя функция fN-1 в (29.1) представляет собой доход от оставшихся N — 1 стадий, до начала осуществления которых возраст оборудования составляет один год.

Аналогичная интерпретация может быть дана уравне­нию для одностадийного процесса. Здесь нет слагаемого вида f0(t + 1), так как N принимает значение 1, 2,..., N. Равенство f0(t) = 0 следует из определения функции fN(t).

Уравнения (29.1) и (29.2) являются рекуррентными соот­ношениями, которые позволяют определить величину fN(t) в зависимости от fN-1(t + 1). Структура этих уравнений показы­вает, что при переходе от одной стадии процесса к следующей возраст оборудования увеличивается с t до (t + 1) лет, а число оставшихся стадий уменьшается с N до (N 1).

Расчет начинают с использования уравнения (29.1). Урав­нения (29.1) и (29.2) позволяют оценить варианты замены и сохранения оборудования, с тем чтобы принять тот из них, ко­торый предполагает больший доход. Эти соотношения дают возможность не только выбрать линию поведения при реше­нии вопроса о сохранении или замене оборудования, но и опре­делить прибыль, получаемую при принятии каждого из этих решений.

Оптимальное распределение ресурсов

 

Пусть имеется некоторое количество ресурсов х, которое необходимо распределить между п различными предприяти­ями, объектами, работами и т.д. так, чтобы получить мак­симальную суммарную эффективность от выбранного способа распределения.

Введем обозначения: xi — количество ресурсов, выделен­ных i-му предприятию (i = );

gi(xi) — функция полезности, в данном случае это величи­на дохода от использования ресурса xi, полученного i-м пред­приятием;

fk(x) — наибольший доход, который можно получить при использовании ресурсов х от первых k различных предприя­тий.

Сформулированную задачу можно записать в математи­ческой форме:

 

 

 

при ограничениях:

 

 

 

Для решения задачи необходимо получить рекуррентное соотношение, связывающее fk(x) и fk-1(x).

Обозначим через хk количество ресурса, используемого k-м способом (0 ≤ xkх), тогда для (k — 1) способов остается ве­личина ресурсов, равная (x xk). Наибольший доход, который получается при использовании ресурса (xxk) от первых (k1) способов, составит fk-1(xxk).

Для максимизации суммарного дохода от k-гo и первых (k — 1) способов необходимо выбрать xk таким образом, чтобы выполнялись соотношения

 

 

 

Рассмотрим конкретную задачу по распределению капита­ловложений между предприятиями.

 

Распределение инвестиций для эффективного использования потенциала предприятия

 

Совет директоров фирмы рассматривает предложения по наращиванию производственных мощностей для увеличения выпуска однородной продукции на четырех предприятиях, при­надлежащих фирме.

Для расширения производства совет директоров выделя­ет средства в объеме 120 млн р. с дискретностью 20 млн р. Прирост выпуска продукции на предприятиях зависит от вы­деленной суммы, его значения представлены предприятиями и содержатся в табл. 29.3.

Найти распределение средств между предприятиями, обес­печивающее максимальный прирост выпуска продукции, при­чем на одно предприятие можно осуществить не более одной инвестиции.

 

 

 


 

 

© gos2012asu

Бесплатный хостинг uCoz