数学建模-动态规划

更新时间：2024-02-01 15:38:01 阅读量：教育文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

-56-

第四章动态规划

§1 引言

1.1 动态规划的发展及研究内容

动态规划（dynamic programming）是运筹学的一个分支，是求解决策过程（decision process）最优化的数学方法。20 世纪50 年代初R. E. Bellman 等人在研究多阶段决策过程(multistep decision process)的优化问题时，提出了著名的最优性原理（principle of

optimality），把多阶段过程转化为一系列单阶段问题，逐个求解，创立了解决这类过程优化问题的新方法—动态规划。1957 年出版了他的名著《Dynamic Programming》，这是该领域的第一本著作。

动态规划问世以来，在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题，用动态规划方法比用其它方法求解更为方便。

虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题，但是一些与时

间无关的静态规划（如线性规划、非线性规划），只要人为地引进时间因素，把它视为多阶段决策过程，也可以用动态规划方法方便地求解。

应指出，动态规划是求解某类问题的一种方法，是考察问题的一种途径，而不是

一种特殊算法（如线性规划是一种算法）。因而，它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则，而必须对具体问题进行具体分析处理。因此，在学习时，除了要对基本概念和方法正确理解外，应以丰富的想象力去建立模型，用创造性的技巧去求解。

例1 最短路线问题

图1 是一个线路网，连线上的数字表示两点之间的距离（或费用）。试寻求一条由A 到G 距离最短（或费用最省）的路线。

图1 最短路线问题

例2 生产计划问题

工厂生产某种产品，每单位（千件）的成本为1（千元），每次开工的固定成本为3

（千元），工厂每季度的最大生产能力为6（千件）。经调查，市场对该产品的需求量第一、二、三、四季度分别为2，3，2，4（千件）。如果工厂在第一、二季度将全年的需求都生产出来，自然可以降低成本（少付固定成本费），但是对于第三、四季度才能上市的产品需付存储费，每季每千件的存储费为0.5（千元）。还规定年初和年末这种产品均无库存。试制定一个生产计划，即安排每个季度的产量，使一年的总费用（生产成本和存储费）最少。

1.2 决策过程的分类

根据过程的时间变量是离散的还是连续的，分为离散时间决策过程（discrete-time

-57-

decision process）和连续时间决策过程（continuous-time decision process）；根据过程的演变是确定的还是随机的，分为确定性决策过程（deterministic decision process）和随机性决策过程（stochastic decision process），其中应用最广的是确定性多阶段决策过程。 §2 基本概念、基本方程和计算方法

2.1 动态规划的基本概念和基本方程

一个多阶段决策过程最优化问题的动态规划模型通常包含以下要素。 2.1.1 阶段

阶段(step)是对整个过程的自然划分。通常根据时间顺序或空间顺序特征来划分阶段，以便按阶段的次序解优化问题。阶段变量一般用k = 1,2,L,n表示。在例1 中由A 出发为k = 1，由B (i = 1,2) i 出发为k = 2，依此下去从F (i =1,2) i 出发为k = 6，共 n = 6个阶段。在例2 中按照第一、二、三、四季度分为k = 1,2,3,4，共四个阶段。 2.1.2 状态

状态（state）表示每个阶段开始时过程所处的自然状况。它应能描述过程的特征并且无后效性，即当某阶段的状态变量给定时，这个阶段以后过程的演变与该阶段以前各阶段的状态无关。通常还要求状态是直接或间接可以观测的。

描述状态的变量称状态变量（state variable）。变量允许取值的范围称允许状态集合 (set of admissible states)。用k x 表示第k 阶段的状态变量，它可以是一个数或一个向量。用k X 表示第k 阶段的允许状态集合。在例1 中2 x 可取1 2 B ,B ，或将i B 定义为

i(i = 1,2)，则1 2 x = 或2，而{1,2} 2 X = 。

n 个阶段的决策过程有n +1个状态变量，n+1 x 表示n x 演变的结果。在例1 中7 x 取 G ，或定义为1，即1 7 x = 。

根据过程演变的具体情况，状态变量可以是离散的或连续的。为了计算的方便有时将连续变量离散化；为了分析的方便有时又将离散变量视为连续的。状态变量简称为状态。 2.1.3 决策

当一个阶段的状态确定后，可以作出各种选择从而演变到下一阶段的某个状态，这种选择手段称为决策（decision），在最优控制问题中也称为控制（control）。描述决策的变量称决策变量（decision variable），变量允许取值的范围称允许决策集合（set of admissible decisions）。用( ) k k u x 表示第k 阶段处于状态k x 时的决策变量，它是k x 的函数，用( ) k k U x 表示k x 的允许决策集合。在例1中( ) 2 1 u B 可取1 2 C ,C 或3 C ，

可记作(1) 1,2,3 2 u = ，而(1) {1,2,3} 2 U = 。决策变量简称决策。 2.1.4 策略

决策组成的序列称为策略（policy）。由初始状态1 x 开始的全过程的策略记作 ( ) 1 1 p x n ，即

( ) { ( ), ( ), , ( )} 1n 1 1 1 2 2 n n p x = u x u x L u x .

由第k 阶段的状态k x 开始到终止状态的后部子过程的策略记作( ) kn k p x ，即

( ) { ( ), , ( )} kn k k k n n p x = u x L u x ，k = 1,2,L, n ?1.

类似地，由第k 到第j 阶段的子过程的策略记作

-58-

( ) { ( ), , ( )} kj k k k j j p x = u x L u x .

可供选择的策略有一定的范围，称为允许策略集合(set of admissible policies)，用

( ), ( ), ( ) 1n 1 kn k kj k P x P x P x 表示。

2.1.5. 状态转移方程

在确定性过程中，一旦某阶段的状态和决策为已知，下阶段的状态便完全确定。用状态转移方程（equation of state transition）表示这种演变规律，写作

( , ), 1,2, , . 1 x T x u k n k = k k k = L + （1）

在例1 中状态转移方程为( ) k 1 k k x = u x + 。 2.1.6. 指标函数和最优值函数

指标函数(objective function)是衡量过程优劣的数量指标，它是定义在全过程和所有后部子过程上的数量函数，用( , , , , ) k ,n k k k +1 n+1 V x u x L x 表示，k = 1,2,L,n。指标函数应具有可分离性，即k n V , 可表为k k k n x u V 1, , , + 的函数，记为

( , , , , ) ( , , ( , , , )) , +1 +1 +1, +1 +1 +1 = k n k k k n k k k k n k k n V x u x L x ?x u V x u L x

并且函数k

?对于变量k n V +1, 是严格单调的。

过程在第j 阶段的阶段指标取决于状态j x 和决策j u ，用( , ) j j j v x u 表示。指标函数由v ( j 1,2, ,n) j = L 组成，常见的形式有：阶段指标之和，即

+ + n j k

k n k k k n j j j

V (x ,u , x , , x ) v (x ,u ) , 1 L 1 ，

阶段指标之积，即

+ + n j k

k n k k k n j j j

V (x ,u , x , , x ) v (x ,u ) , 1 L 1 ，

阶段指标之极大（或极小），即

( , , , , ) max(min) ( , ) k ,n k k k 1 n 1 k j n j j j V x u x x v x u

+ + ≤≤

L = .

这些形式下第k 到第j阶段子过程的指标函数为( , , , ) k , j k k j+1 V x u L x 。

根据状态转移方程指标函数k n V , 还可以表示为状态k x 和策略kn p 的函数，即

( , ) k ,n k kn V x p 。在k x 给定时指标函数k n V , 对kn p 的最优值称为最优值函数（optimal value

function），记为( ) k k f x ，即

( ) opt ( , ) ,

( ) k n k kn

p P x k k

f x V x p

kn∈kn k

= ，

其中opt 可根据具体情况取max 或min 。

2.1.7 最优策略和最优轨线

使指标函数k n V , 达到最优值的策略是从k 开始的后部子过程的最优策略，记作

{ * , , *} p = u L u 。*

kn k n 1n

p 是全过程的最优策略，简称最优策略（optimal policy）。从初始状态( * )

1 1 x = x 出发，过程按照*

1n p 和状态转移方程演变所经历的状态序列 { , , , * }

1 * 2 *

1 n+

x x L x 称最优轨线（optimal trajectory）。

-59-

2.1.8 递归方程

如下方程称为递归方程

?? ??? = ? = =

+ + ∈ + +

( ) opt { ( , ) ( )}, , ,1 ( ) 0 1

1 1 ( ) 1 1

f x v x u f x k n L f x

k k k k k u U x k k n n

k k k

或

（2）

在上述方程中，当?为加法时取( ) 0 1 1 = n+ n+ f x ；当?为乘法时，取( ) 1 1 1 = n+ n+ f x 。动

态规划递归方程是动态规划的最优性原理的基础，即：最优策略的子策略，构成最优子策略。用状态转移方程（1）和递归方程（2）求解动态规划的过程，是由k = n +1逆推至k = 1，故这种解法称为逆序解法。当然，对某些动态规划问题，也可采用顺序解法。这时，状态转移方程和递归方程分别为：

x T x u k n k k

k k

( , ), 1, , = 1 = L + ，

?? ?? ? = ? = =

+ ? ∈ +

+ +

f x v x u f x k n f x

k k k k k u U x k k

k r k k

( ) opt { ( , ) ( )}, 1, , ( 0 1

1 1 ( ) 1 0 1

1 1

L ）或

例3 用lingo 求解例1 最短路线问题。 model:

Title Dynamic Programming; sets:

vertex/A,B1,B2,C1,C2,C3,C4,D1,D2,D3,E1,E2,E3,F1,F2,G/:L;

road(vertex,vertex)/A B1,A B2,B1 C1,B1 C2,B1 c3,B2 C2,B2 C3,B2 C4, C1 D1,C1 D2,C2 D1,C2 D2,C3 D2,C3 D3,C4 D2,C4 D3, D1 E1,D1 E2,D2 E2,D2 E3,D3 E2,D3 E3,

E1 F1,E1 F2,E2 F1,E2 F2,E3 F1,E3 F2,F1 G,F2 G/:D; endsets

data:

D=5 3 1 3 6 8 7 6 6 8 3 5 3 3 8 4 2 2 1 2 3 3 3 5 5 2 6 6 4 3; L=0,,,,,,,,,,,,,,,; enddata

@for(vertex(i)|i#GT#1:L(i)=@min(road(j,i):L(j)+D(j,i))); end

纵上所述，如果一个问题能用动态规划方法求解，那么，我们可以按下列步骤，首先建立起动态规划的数学模型：（i）将过程划分成恰当的阶段。

（ii）正确选择状态变量k x ，使它既能描述过程的状态，又满足无后效性，同时确定允许状态集合k X 。

（iii）选择决策变量k u ，确定允许决策集合( ) k k U x 。（iv）写出状态转移方程。

（v）确定阶段指标( , ) k k k v x u 及指标函数kn V 的形式（阶段指标之和，阶段指标之积，阶段指标之极大或极小等）。

（vi）写出基本方程即最优值函数满足的递归方程，以及端点条件。 §3 逆序解法的计算框图

-60-

以自由终端、固定始端、指标函数取和的形式的逆序解法为例给出计算框图，其它情况容易在这个基础上修改得到。一般化的自由终端条件为

1 1, 1, 1

( ) ( ), 1,2, , + + + + = = n n i n i n f x ?x i L n (3)

其中?为已知。固定始端条件可表示为{ } { *}

X = x = x 。

如果状态k x 和决策k u 是连续变量，用数值方法求解时需按照精度要求进行离散化。设状态k x 的允许集合为

1 1 1

X x i n i n k n k ki k k = { | = 1,2,L, }, = 1,2,L, , = 1,2,L, .

决策( ) ki ki u x 的允许集合为

U u j n i n k n ki k

ki ki

= { ( ) | = 1,2,L, }, = 1,2,L, , = 1,2,L, .

状态转移方程和阶段指标应对k x 的每个取值ki x 和ki u 的每个取值( j)

u 计算，即 ( , ( j) )

k k ki ki T = T x u ，( , ( j) )

k ki ki v = v x u 。最优值函数应对k x 的每个取值ki x 计算。基本方

程可以表为

1,2, , , 1,2, , , , ,2,1. ( ) opt ( ), ( ) ( , ) ( ( , )),

( ) ( ) 1 ( ) ( )

j L n i L n k n L f x f x

f x v x u f T x u

ki k ki j k j k ki j k k ki ki j ki k ki ki j k

= = = = = + +

（4）

图2 解法框图 -61-

按照（3），（4）逆向计算出( * )

1 1 f x ，为全过程的最优值。记状态ki x 的最优决策为

( )

ki ki u x ，由* 1 x 和* ( )

ki ki u x 按照状态转移方程计算出最优状态，记作* k x 。并得到相应的最优决策，记作* ( * )

k k u x 。于是最优策略为{ ( ), ( * ), , * ( * )}

* 2

* 2 * 1 *

1 n n

u x u x L u x 。

算法程序的框图如图2 所示。

图的左边部分是函数序列的递推计算，可输出全过程最优值( * )

1 1

f x ，如果需要还

可以输出后部子过程最优值函数序列( ) k ki f x 和最优决策序列* ( ) k ki u x 。计算过程中存

( ) k ki f x 是备计算k ?1 f 之用，在k ?1 f 算完后可用k ?1 f 将k f 替换掉；存* ( ) k ki u x 是备右边部分读* ( * ) k k u x 之用。

图的右边部分是最优状态和最优决策序列的正向计算，可输出最优策略

{ ( ), ( * ), , * ( * )}

2 * 2 * 1 *

1 n n 2 *

u x u x L u x 和最优轨线{ , * , , *}

1 n

x x L x 。

§4 动态规划与静态规划的关系

动态规划与静态规划（线性和非线性规划等）研究的对象本质上都是在若干约束条件下的函数极值问题。两种规划在很多情况下原则上可以相互转换。

动态规划可以看作求决策n u ,u , ,u 1 2 L 使指标函数( , , , ) 1n 1 1 2 n V x u，u L u 达到最优（最大或最小）的极值问题，状态转移方程、端点条件以及允许状态集、允许决策集等是约束条件，原则上可以用非线性规划方法求解。

一些静态规划只要适当引入阶段变量、状态、决策等就可以用动态规划方法求解。下面用例子说明。

例4 用动态规划解下列非线性规划

n k

k k 1

g u

max ( )；

s.t.

= ≥

n k k k 1

u a u

, 0 .

其中( ) k k g u 为任意的已知函数。

解按变量k u 的序号划分阶段，看作n段决策过程。设状态为1 2 1 , , , n+ x x L x ，取问题中的变量n u ,u , ,u 1 2 L 为决策。状态转移方程为

, , 1,2, , . 1 1 x a x x u k n = k = k ?k = L +

取( ) k k g u 为阶段指标，最优值函数的基本方程为（注意到0 1 = n+ x ）

( ) max [ ( ) ( )] 0 1 1 ≤≤ + + = + k k u x k k k k f x g x f x

k k

；

0 ≤x ≤a, k = n,n ?1,L,2,1 k ； (0) 0 1 = n+ f .

按照逆序解法求出对应于k x 每个取值的最优决策* ( )

k k

u x ，计算至( ) 1 f a 后即可利

用状态转移方程得到最优状态序列{ *} k x 和最优决策序列{ * ( * )}

k k

u x 。

与静态规划相比，动态规划的优越性在于：

（i）能够得到全局最优解。由于约束条件确定的约束集合往往很复杂，即使指标

函数较简单，用非线性规划方法也很难求出全局最优解。而动态规划方法把全过程化为

-62-

一系列结构相似的子问题，每个子问题的变量个数大大减少，约束集合也简单得多，易于得到全局最优解。特别是对于约束集合、状态转移和指标函数不能用分析形式给出的优化问题，可以对每个子过程用枚举法求解，而约束条件越多，决策的搜索范围越小，求解也越容易。对于这类问题，动态规划通常是求全局最优解的唯一方法。

（ii）可以得到一族最优解。与非线性规划只能得到全过程的一个最优解不同，动

态规划得到的是全过程及所有后部子过程的各个状态的一族最优解。有些实际问题需要这样的解族，即使不需要，它们在分析最优策略和最优值对于状态的稳定性时也是很有用的。当最优策略由于某些原因不能实现时，这样的解族可以用来寻找次优策略。（iii）能够利用经验提高求解效率。如果实际问题本身就是动态的，由于动态规划

方法反映了过程逐段演变的前后联系和动态特征，在计算中可以利用实际知识和经验提高求解效率。如在策略迭代法中，实际经验能够帮助选择较好的初始策略，提高收敛速度。

动态规划的主要缺点是：

（i）没有统一的标准模型，也没有构造模型的通用方法，甚至还没有判断一个问题能否构造动态规划模型的准则。这样就只能对每类问题进行具体分析，构造具体的模型。对于较复杂的问题在选择状态、决策、确定状态转移规律等方面需要丰富的想象力和灵活的技巧性，这就带来了应用上的局限性。

（ii）用数值方法求解时存在维数灾（curse of dimensionality）。若一维状态变量有m 个取值，那么对于n维问题，状态xk 就有mn个值，对于每个状态值都要计算、存储函数( ) k k f x ，对于n稍大的实际问题的计算往往是不现实的。目前还没有克服维数灾的有效的一般方法。

§5 若干典型问题的动态规划模型 5.1 最短路线问题

对于例1 一类最短路线问题（shortest Path Problem），阶段按过程的演变划分，状态由各段的初始位置确定，决策为从各个状态出发的走向，即有( ) k 1 k k x = u x + ，阶段指标为相邻两段状态间的距离( , ( )) k k k k d x u x ，指标函数为阶段指标之和，最优值函数 ( ) k k f x 是由k x 出发到终点的最短距离（或最小费用），基本方程为

( ) min[ ( , ( )) ( )], , ,1; ( ) 1 1 f x d x u x f x k n L k k u x k k k k k k

k k

= + = + +

( ) 0. 1 1 = n+ n+ f x

利用这个模型可以算出例l的最短路线为AB C D E F G 1 2 1 2 2 ，相应的最短距离为18。 5.2 生产计划问题

对于例2 一类生产计划问题（Production planning problem），阶段按计划时间自然划分，状态定义为每阶段开始时的储存量k x ，决策为每个阶段的产量k u ，记每个阶段的需求量（已知量）为k d ，则状态转移方程为

, 0, 1,2, , . 1 x x u d x k n k = k + k ?k k ≥ = L + (5)

设每阶段开工的固定成本费为a ，生产单位数量产品的成本费为b ，每阶段单位数量产品的储存费为c ，阶段指标为阶段的生产成本和储存费之和，即

??? + > = + 0 , 0 ( , ) k k

k k k k

a bu u v x u cx (6)

-63-

指标函数Vkn 为vk 之和。最优值函数( ) k k f x 为从第k 段的状态k x 出发到过程终结的最

小费用，满足

( ) min[ ( , ) ( )], , ,1. f x v x u f 1 x 1 k n L k k u U k k k k k

k k

= + = ∈ + +

其中允许决策集合k U 由每阶段的最大生产能力决定。若设过程终结时允许存储量为

x ，则终端条件是 ( 0 ) 0.

1 1 = n+ n+ f x （7）

n+1

（5）~（7）构成该问题的动态规划模型。 5.3 资源分配问题

一种或几种资源（包括资金）分配给若干用户，或投资于几家企业，以获得最大的效益。资源分配问题（resource allocating Problem）可以是多阶段决策过程，也可以是静态规划问题，都能构造动态规划模型求解。下面举例说明。

例5 机器可以在高、低两种负荷下生产。u台机器在高负荷下的年产量是g(u)，在低负荷下的年产量是h(u) ，高、低负荷下机器的年损耗率分别是1 a 和1 b

（0 1 1 1 h(u) = βu（α>β>0），即高、低负荷下每台机器的年产量分别为α和β，结果将

有什么特点。

解年度为阶段变量k = 1,2,L, n。状态k x 为第k 年初完好的机器数，决策k u 为第k 年投入高负荷运行的台数。当k x 或k u 不是整数时，将小数部分理解为一年中正常工作时间或投入高负荷运行时间的比例。

机器在高、低负荷下的年完好率分别记为a 和b ，则1 a = 1?a ，1 b = 1?b ，有 a

( , ) ( ) ( ) k k k k k k v x u = g u + h x ?u （9）

指标函数是阶段指标之和，最优值函数( ) k k f x 满足 0 , , ,2,1.

( ) max [ ( , ) ( )], 0 1 1 x m k n L f x v x u f x

k k u x k k k k k

k k

≤≤ =

= + ≤≤ + + (10)

及自由终端条件

( ) 0, 0 . 1 1 1 f x x m n n n = ≤≤+ + + （11）

当k v 中的g, h用较简单的函数表达式给出时，对于每个k 可以用解析方法求解极

值问题。特别，若g(u) =αu ，h(u) = βu，（10）中的[ ( , ) ( )] k k k k 1 k v x u f x + + 将是

的线性函数，最大值点必在区间k k 0 ≤u ≤x 的左端点= 0 k u 或右端点k k u = x 取得，即每年初将完好的机器全部投入低负荷或高负荷运行。

§6 具体的应用实例

例6 设某工厂有1000 台机器，生产两种产品A、B，若投入x台机器生产A产

-64-

品，则纯收入为5x ，若投入y 台机器生产B种产品，则纯收入为4y，又知：生产A种产品机器的年折损率为20%，生产B 产品机器的年折损率为10%，问在5 年内如何安排各年度的生产计划，才能使总收入最高？解年度为阶段变量k = 1,2,3,4,5。

令k x 表示第k 年初完好机器数，k u 表示第k 年安排生产A 种产品的机器数，则 k k x ?u 为第k 年安排生产B种产品的机器数，且k k 0 ≤u ≤x 。则第k +1年初完好的机器数

x (1 0.2)u (1 0.1)(x u ) 0.9x 0.1u 1 = ? + ?? = ?+ （12）

令( , ) k k k v x u 表示第k 年的纯收入，( ) k k f x 表示第k 年初往后各年的最大利润之

k k k k k k

和。显然

( ) 0 6 6 f x = （13）

则

( ) max { ( , ) ( )} 0 1 1 ≤≤ + + = + k k u x k k k k k f x v x u f x

k k

max {5 4( ) ( )} max { 4 ( )} 0 1 1 0 1 1 ≤≤ + + ≤≤ + + = + ? + = + + u x k k k k k u x k k k k u x u f x u x f x

k k k k

（14）

（1）k = 5时，由（13）、（14）式得

( ) max { 4 } 5 5 0 5 5

5 5

f x u x

u x

= +

≤≤

u + 4x 关于5 u 求导，知其导数大于零，所以5 5 u + 4x 在5 u 等于5 x 处取得最大值，即5 5 u = x 时，5 5 5 f (x ) = 5x 。

（2）k = 4时，由（12）、（14）式得 ( ) max { 4 5 } 4 4 0 4 4 5

5 5

4 4

f x u x x

u x

= + +

≤≤

max { 4 5(0.9 0.1 )} max {0.5 8.5 } 0 4 4 4 4 0 4 4 4 4 4 4 u x x u u x

u x u x

= + + ? = +

≤≤≤≤

当4 4 u = x 时，4 4 4 f (x ) = 9x （3）k = 3时，

( ) max { 4 9 } 3 3 0 3 3 4

3 3

f x u x x

u x

= + +

≤≤

max { 4 9(0.9 0.1 )} max {0.1 12.1 } 0 3 3 3 3 0 3 3 3 3 3 3 u x x u u x

u x u x

= + + ? = +

≤≤≤≤

当3 3 u = x 时，3 3 3 f (x ) = 12.2x （4）k = 2时，

( ) max { 4 12.2 } max { 0.22 14.98 } 2 2 0 2 2 3 0 2 2

2 2 2 2

f x u x x u x

u x u x

= + + = ? +

≤≤≤≤

当0 2 u = 时，2 2 2 f (x ) = 14.98x 。（5）k = 1时，

( ) max{ 4 14.98 } max{ 0.498 17.482 } 1 1 0 1 1 2 0 1 1

1 1 1 1

f x u x x u x

u x u x

= + + = ? +

≤≤≤≤

当0 1 u = 时，1 1 1 f (x ) = 17.482x 。因为 1000 1 x = （台）

-65-

所以由（12）式，进行回代得

0.9 0.1 900 2 1 1 x = x ?u = （台） 0.9 0.1 810 3 2 2 x = x ?u = （台） 0.9 0.1 648 4 3 3 x = x ?u = （台）

0.9 0.1 518.4 5 4 4 x = x ?u = （台）

注：518.4 5 x = 台中的0.4 台应理解为有一台机器只能使用0.4 年将报废。

例7 求解下面问题

3 2

max z = u u u ??? ≥ =

+ + = > 0 1,2,3 ( 0) 1 2 3 u i

u u u c c

1 2 i

解：按问题的变量个数划分阶段，把它看作为一个三阶段决策问题。设状态变量

为1 2 3 4 x , x , x , x ，并记x = c 1 ；取问题中的变量1 2 3 u ,u ,u 为决策变量；各阶段指标函数

按乘积方式结合。令最优值函数( ) k k f x 表示第k 阶段的初始状态为k x ，从k 阶段到3 阶段所得到的最大值。

设3 3 x = u ，3 2 2 x + u = x ，x + u = x = c 2 1 1 则有

3 3

u = x ，2 2 0 ≤u ≤x ，1 1 0 ≤u ≤x ( ) max{ }

用逆推解法，从后向前依次有

3 3 3 3

3 3

f x u x

u x

= =

及最优解3

u = x

( ) max { ( )} max { ( )} max ( , ) 2 2 0 2 2 2

3 2 3 3 0 2 2 2 2 0 2

2 2 2 2 2 2

f x u f x u x u h u x

≤u ≤x ≤u ≤x ≤u ≤x

= = ? = 由2 3 2 0

2 2 2 2

= u x ?u = du dh

，得2 2 3

u = 2 x 和0 2 u = （舍去）

又2 2 2

2 2 2

2x 6u du

d h = ?，而2 0 2

3 2 2 2 2 2

2 2

= ?<

x du d h

u x

，故2 2 3

u = 2 x 为极大值点。

所以3

f (x ) = 4 x 及最优解2

2 2 2 *

u = 2 x 。 ( ) } 27

( ) max{ ( )} max{ 4 3

1 1 0 1 2 2 0 1 1 1

1 1 1 1

f x u f x u x u

u x u x

= = ?

≤≤≤≤

同样利用微分法易知4

1 1 1

f (x ) = 1 x ，最优解1

u = 1 x 。

由于1 x 已知，因而按计算的顺序反推算，可得各阶段的最优决策和最优值。即 u c 4 * 1 1 = ，4 1 1 64

f (x ) = 1 c

由

x x u c c c 4 3 4 * 1

2 1 1 = ? = ? =

-66-

所以

u x c 2 1 3 2

2 *

= = ，3 2 2 16

f (x ) = 1 c

由

x x u c c c 4 1 2 1 4 * 3

3 2 2 = ? = ? =

所以

u c 4 * 1

3 = ，f x c

( ) 1 3 3 =

因此得到最优解为：u c

4 * 1

1 = ，u c 2 * 1

2 = ，u c 4 * 1 3 = ；

最大值为：4

max z = f (c) = 1 c 。

习题四

1. 用Matlab 编程求例6 的解。

2. 有四个工人，要指派他们分别完成4 项工作，每人做各项工作所消耗的时间如表1 所示。

表1 工作

工人A B C D 甲15 18 21 24 乙19 23 22 18 丙26 17 16 19 丁19 21 23 17

问指派哪个人去完成哪项工作，可使总的消耗时间为最小？试对此问题用动态规划方法求解。

3. 为保证某一设备的正常运转，需备有三种不同的零件1 2 3 E , E , E 。若增加备用零件的数量，可提高设备正常运转的可靠性，但增加了费用，而投资额仅为8000 元。已知备用零件数与它的可靠性和费用的关系如表2 所示。

表2

增加的可靠性设备的费用（千元）备件数

E 2 E 3 E 1 E 2 E 3 E

1 2 3 0.3 0.4 0.5 0.2 0.5 0.9

0.1 0.2 0.7 1 2 3 3 5 6 2 3 4

现要求在既不超出投资额的限制，又能尽量提高设备运转的可靠性的条件下，问各种零件的备件数量应是多少为好？

4. 某工厂购进100 台机器，准备生产I、II 两种产品，若生产产品I，每台机器每年可收入45 万元，损坏率为65％；若生产产品II，每台机器每年收入为35 万元，损坏率为35％，估计三年后将有新型机器出现，旧的机器将全部淘汰。试问每年应如何

-67-

安排生产，使在三年内收入最多？

5．3 名商人各带1 名随从乘船渡河，一只小船只能容纳2 人，由他们自己划行。

随从们密约，在河的任一岸，一旦随从人数比商人多，就杀商人。此密约被商人知道，如何乘船渡河的大权掌握在商人们手中，商人们怎样安排每次乘船方案，才能安全渡河呢？

6．某一印刷厂有六项加工任务，对印刷车间和装订车间所需时间（单位：天）如表3 所示，试求最优的加工顺序和总加工天数。

表3 任务

车间1 2 3 4 5 6 印刷车间装订车间 3 8 10 12 5 9 2 6 9 5 11 2__

本文来源：https://www.bwwdw.com/article/epdw.html

相关文章：

数学建模-动态规划
数学建模算法合集之《动态规划的特点及其应用》
数学建模 - - 生产规划问题
动态规划
数学建模实验答案 - - 数学规划模型二
数学建模实验答案 - - 数学规划模型二
动态规划
动态规划
数学建模案例之线性规划
数学建模非线性规划(xin)

正在阅读：
数学建模-动态规划02-01
12字经典语录02-06
秋天的声音作文03-31
福建连城县第一中学2022届高三上学期期中联考数学试卷 Word版含04-17
《红星照耀中国》1-12章导读练习及答案03-24
开利冷水机组参数表09-01
关于股利分配政策影响因素研究综述10-19
给水计算书06-02
MBA排名：中国高校MBA排行榜100强（参考） - 图文01-04
行政领导学作业指导05-28

上一篇：内包装材料取样操作规程 - 图文下一篇：四级笔试新题型模拟题09