算法之动态规划

最新推荐文章于 2025-03-02 18:03:32 发布

djd已经存在

最新推荐文章于 2025-03-02 18:03:32 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

分类专栏：数据结构算法学习文章标签：动态规划

本文链接：https://blog.youkuaiyun.com/djd1234567/article/details/46991453

数据结构算法学习专栏收录该内容

102 篇文章

订阅专栏

本文深入探讨了动态规划的基本概念与应用原则，并详细分析了01背包问题的求解过程，包括状态转移方程及代码实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一：思想

首先要了解”动态规划“，必须先知道什么叫做”多阶段决策“，百科里面对这个问题解释的很全，我就load一段出来，

大家得要好好品味，好好分析。

上面图中最后一句话就定义了动态规划是要干什么的问题。

二：使用规则

现在我们知道动态规划要解决啥问题了，那么什么情况下我们该使用动态规划呢？

① 最优化原理（最优子结构性质）：

如果一个问题的最优策略它的子问题的策略也是最优的，则称该问题具有“最优子结构性质”。

② 无后效性：

当一个问题被划分为多个决策阶段，那么前一个阶段的策略不会受到后一个阶段所做出策略的影响。

③ 子问题的重叠性：

这个性质揭露了动态规划的本质，解决冗余问题，重复的子问题我们可以记录下来供后阶段决策时

直接使用，从而降低算法复杂度。

三：求解步骤

① 描述最优解模型。

② 递归的定义最优解，也就是构造动态规划方程。

③ 自底向上的计算最优解。

④ 最后根据计算的最优值得出问题的最佳策略。

四：与其他算法的差异

① 递归：递归采用的是“由上而下”的解题策略并带有可能的”子问题“重复调用，时间复杂度自然高。

而”动态规划“采用”自下而上“并带有临时存储器保存上一策略的最优解，空间换时间。

② 分治：同样两者都是将问题划分为很多的子问题，不同的是”动态规划“中各子问题是相互联系的。

③ 贪心：要注意的是贪心算法每走一步都是不可撤回的，而动态规划是在一个问题的多种策略中寻找

最优策略，所以动态规划中前一种策略可能会被后一种策略推翻。

背包问题
01背包: 有N件物品和一个重量为M的背包。（每种物品均只有一件）第i件物品的重量是w[i]，价值是p[i]。求解将哪些物品装入背包可使价值总和最大。

完全背包: 有N种物品和一个重量为M的背包，每种物品都有无限件可用。第i种物品的重量是w[i]，价值是p[i]。求解将哪些物品装入背包可使这些物品的费用总和不超过背包重量，且价值总和最大。

多重背包: 有N种物品和一个重量为M的背包。第i种物品最多有n[i]件可用，每件重量是w[i]，价值是p[i]。求解将哪些物品装入背包可使这些物品的费用总和不超过背包重量，且价值总和最大。

先来分析01背包：

01背包（ZeroOnePack）: 有N件物品和一个容量为V的背包，每种物品均只有一件。第i件物品的费用是c[i]，价值是w[i]。求解将哪些物品装入背包可使价值总和最大。
这是最基础的背包问题，特点是：每种物品仅有一件，可以选择放或不放。
用子问题定义状态：即f[i][v]表示前i件物品恰放入一个容量为v的背包可以获得的最大价值。则其状态转移方程便是：

f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]+w[i]}

把这个过程理解下：
在前i件物品放进容量v的背包时，它有两种情况

情况一: 第i件不放进去，这时所得价值为:f[i-1][v]
情况二: 第i件放进去，这时所得价值为：f[i-1][v-c[i]]+w[i]

（第二种是什么意思？就是如果第i件放进去，那么在容量v-c[i]里就要放进前i-1件物品）
最后比较第一种与第二种所得价值的大小，哪种相对大，f[i][v]的值就是哪种。（这里是重点，理解！）

这里可以将2维数组降为1维数组，用f[0...v]表示，f[v]表示把前i件物品放入容量为v的背包里得到的价值。

把i从1-n循环后，最后f[v]表示所求最大值。

这里的f[v]就相当于f[i][v]，那么，如何得到f[i-1][v]和f[i-1][v-c[i]]+w[i]？

首先要知道，我们是通过i从1-n的循环来表示前i件物品存入的状态。即for i = 1...n

现在思考如何能在是f[v]表示当前状态是容量为v的背包所得价值，而又使f[v]和f[v-c[i]]+w[i]标签前一状态的价值？

逆序这就是关键

<strong>for i=1..N 
    for v=V..0 
	 f[v]=max{f[v],f[v-c[i]]+w[i]};</strong>

分析上面的代码：当内循环是逆序时，就可以保证后一个f[v]和f[v-c[i]]+w[i]是前一状态的！这里给大家一组测试数据：
测试数据： 10,3 3,4 4,5 5,6

i = 0是初始化，为了i = 1的时候递推时使用，i = 1时因为物品1的大小为3，所以大于3时物品价值均为4。

i = 2时从10开始循环回来，只要有空间时就放入物品2，放不下时但是可以替换时就用物品2替换物品1，因为背包空间大于物品2却小于物品1+物品2时就取价值大的一个。

i = 3时从10开始循环，代入状态转移方程可以得到最大值。

这里以一道题目来具体看看：
题目：http://acm.hdu.edu.cn/showproblem.php?pid=2602
题目大意：从给定各种价值和体积的物品中选取n件，装进容积为v背包。问最多背

包中能装多少价值的东西。
5 10(n<=1000 v<=1000)
1 2 3 4 5 (每一件对应的价值 )value[1002]
5 4 3 2 1 (每一件的重量)weight[1002]

问最多背包中能装多少价值的东西。
14

#include
#include
int value[50001],weight[50001],record[50001];
int main()
{
    int T;
    scanf("%d",&T);
    while(T--)
    {
        int i,j;
        int N,V;//m<=2000,v<=50000
        scanf("%d%d",&N,&V);//物品种类，背包容量
        for(i=1;i<=N;i++)
        {
            scanf("%d",&value[i]);//(价值)
        }
        for(i=1;i<=N;i++)
        {
            scanf("%d",&weight[i]);//(重量)
        }
        memset(record,0,sizeof(record));
        record[0]=0;
<strong>        for(i=1;i<=N;i++)
        {
            for(j=V;j>=0;j--)
            { 
                if( j-weight[i]>=0 && (record[j-weight[i]]+value[i])>record[j])
                {
                        record[j]=record[j-weight[i]]+value[i];  
                }
            }
        </strong>}
         
            printf("%d\n",record[V]);
        
    }
    
    return 0;
}