算法之动态规划

本文深入探讨了动态规划的基本概念与应用原则,并详细分析了01背包问题的求解过程,包括状态转移方程及代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一: 思想

   首先要了解”动态规划“,必须先知道什么叫做”多阶段决策“,百科里面对这个问题解释的很全,我就load一段出来,

大家得要好好品味,好好分析。

 

上面图中最后一句话就定义了动态规划是要干什么的问题。

 

二:使用规则

    现在我们知道动态规划要解决啥问题了,那么什么情况下我们该使用动态规划呢?

   ①  最优化原理(最优子结构性质):

           如果一个问题的最优策略它的子问题的策略也是最优的,则称该问题具有“最优子结构性质”。

   ②  无后效性:

           当一个问题被划分为多个决策阶段,那么前一个阶段的策略不会受到后一个阶段所做出策略的影响。

   ③  子问题的重叠性:

          这个性质揭露了动态规划的本质,解决冗余问题,重复的子问题我们可以记录下来供后阶段决策时

        直接使用,从而降低算法复杂度。

 

三:求解步骤

      ①   描述最优解模型。

      ②   递归的定义最优解,也就是构造动态规划方程。

      ③   自底向上的计算最优解。

      ④   最后根据计算的最优值得出问题的最佳策略。

 

四:与其他算法的差异

     ① 递归:  递归采用的是“由上而下”的解题策略并带有可能的”子问题“重复调用,时间复杂度自然高。

                   而”动态规划“采用”自下而上“并带有临时存储器保存上一策略的最优解,空间换时间。

     ② 分治:  同样两者都是将问题划分为很多的子问题,不同的是”动态规划“中各子问题是相互联系的。

     ③ 贪心:  要注意的是贪心算法每走一步都是不可撤回的,而动态规划是在一个问题的多种策略中寻找

                   最优策略,所以动态规划中前一种策略可能会被后一种策略推翻。


背包问题
01背包: 有N件物品和一个重量为M的背包。(每种物品均只有一件)第i件物品的重量是w[i],价值是p[i]。求解将哪些物品装入背包可使价值总和最大。


完全背包: 有N种物品和一个重量为M的背包,每种物品都有无限件可用。第i种物品的重量是w[i],价值是p[i]。求解将哪些物品装入背包可使这些物品的费用总和不超过背包重量,且价值总和最大。


多重背包: 有N种物品和一个重量为M的背包。第i种物品最多有n[i]件可用,每件重量是w[i],价值是p[i]。求解将哪些物品装入背包可使这些物品的费用总和不超过背包重量,且价值总和最大。


先来分析01背包: 


01背包(ZeroOnePack): 有N件物品和一个容量为V的背包,每种物品均只有一件。第i件物品的费用是c[i],价值是w[i]。求解将哪些物品装入背包可使价值总和最大。 
这是最基础的背包问题,特点是:每种物品仅有一件,可以选择放或不放。 
用子问题定义状态:即f[i][v]表示前i件物品恰放入一个容量为v的背包可以获得的最大价值。则其状态转移方程便是: 


f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]+w[i]}


把这个过程理解下:
在前i件物品放进容量v的背包时,它有两种情况


情况一: 第i件不放进去,这时所得价值为:f[i-1][v]
情况二: 第i件放进去,这时所得价值为:f[i-1][v-c[i]]+w[i] 


(第二种是什么意思?就是如果第i件放进去,那么在容量v-c[i]里就要放进前i-1件物品) 
最后比较第一种与第二种所得价值的大小,哪种相对大,f[i][v]的值就是哪种。  (这里是重点,理解!) 

这里可以将2维数组降为1维数组,用f[0...v]表示,f[v]表示把前i件物品放入容量为v的背包里得到的价值。

把i从1-n循环后,最后f[v]表示所求最大值。

这里的f[v]就相当于f[i][v],那么,如何得到f[i-1][v]和f[i-1][v-c[i]]+w[i]?

首先要知道,我们是通过i从1-n的循环来表示前i件物品存入的状态。即for i = 1...n

现在思考如何能在是f[v]表示当前状态是容量为v的背包所得价值,而又使f[v]和f[v-c[i]]+w[i]标签前一状态的价值?


逆序 这就是关键

<strong>for i=1..N 
    for v=V..0 
	 f[v]=max{f[v],f[v-c[i]]+w[i]};</strong>
分析上面的代码:当内循环是逆序时,就可以保证后一个f[v]和f[v-c[i]]+w[i]是前一状态的!这里给大家一组测试数据:  
测试数据: 10,3 3,4 4,5 5,6 



i = 0是初始化,为了i = 1的时候递推时使用,i = 1时因为物品1的大小为3,所以大于3时物品价值均为4。

i = 2时从10开始循环回来,只要有空间时就放入物品2,放不下时但是可以替换时就用物品2替换物品1,因为背包空间大于物品2却小于物品1+物品2时就取价值大的一个。

i = 3时从10开始循环,代入状态转移方程可以得到最大值。

             
这里以一道题目来具体看看: 
题目:http://acm.hdu.edu.cn/showproblem.php?pid=2602 
题目大意:从给定各种价值和体积的物品中选取n件,装进容积为v背包。 问最多背


包中能装多少价值的东西。
5 10(n<=1000 v<=1000)
1 2 3 4 5 (每一件对应的 价值 )value[1002]
5 4 3 2 1 (每一件的重量)weight[1002]


问最多背包中能装多少价值的东西。
14

#include
#include
int value[50001],weight[50001],record[50001];
int main()
{
    int T;
    scanf("%d",&T);
    while(T--)
    {
        int i,j;
        int N,V;//m<=2000,v<=50000
        scanf("%d%d",&N,&V);//物品种类,背包容量
        for(i=1;i<=N;i++)
        {
            scanf("%d",&value[i]);//(价值)
        }
        for(i=1;i<=N;i++)
        {
            scanf("%d",&weight[i]);//(重量)
        }
        memset(record,0,sizeof(record));
        record[0]=0;
<strong>        for(i=1;i<=N;i++)
        {
            for(j=V;j>=0;j--)
            { 
                if( j-weight[i]>=0 && (record[j-weight[i]]+value[i])>record[j])
                {
                        record[j]=record[j-weight[i]]+value[i];  
                }
            }
        </strong>}
         
            printf("%d\n",record[V]);
        
    }
    
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值