动态规划怎么理解-优快云博客

本文链接：https://blog.youkuaiyun.com/lx18854869896/article/details/139891386

网上资料一大堆，没找到一个能说清楚的。结合不清不楚的描述，我研究一番，来尝试解释一下。

那么这个动态规划的基本思路是什么？
首先是数据的初始化，然后是状态转移方程。
举个例子
斐波那契数列：1,1,2,3,5,8,13
代码：

int[] dp = new int[n]; //存放所有数据 dp[n] 就是 第n个数的值
dp[1] = 1; //初始化数据
dp[2] = 1; //初始化数据
for(int i = 2; i < n; i++){ //直接在第三个开始计算
    dp[i] = dp[i-1] + arr[i-2]; //转移方程
}

然后是01背包问题：
描述：
有N件物品和一个容量为V的背包。第i件物品的体积是v[i]，价值是w[i]。求解将哪些物品装入背包可使价值总和最大。
01背包的特点就是：每种物品仅有一件，可以选择放或不放。
如何初始化?
这个一维数组就放不下了，有两个维度，几件物品，多少容量？

int[][] dp = new int[N+1][V+1]; 为什么是N+1，因为代码要处理物品为0的情况。
dp[0][V] = 0; //意义 一件物品也没有，不管有多少容量 价值为0 代码可以省略，int默认就是0
dp[N][0] = 0; //意义 没有容量，有多少物品也放不下 价值为0 代码可以省略，int默认就是0
状态转移
for(int i = 1; i <= N; i++){ //物品数量递增 直接从1开始 因为 dp[0][V] = 0;
    for(int j = 1; j <= V; j++){ //容量递增 直接从1开始 因为 dp[N][0] = 0;
        if(j > wi){ //容量够
            dp[i][j] = Math.max(dp[i-1][j],dp[i-1][j-vi]+wi); // dp[i-1][j] 这个的意义是不放这件物品的价值。
            // dp[i-1][j-vi]+wi 这个的意义是放这件物品的价值。既然要放肯定要把价值wi加上，
            //而dp[i-1][j-vi]，取出该物品占用的空间，放置i-1件物品的最大价值，这个东西在前面已经算过了，直接用。
            //比如我现在是第一个物品体积5，价值6，背包容量有5， 能放，然后放的话价值是6，不放的话价值是0，得放。
            //代码就是 i = 1;v1 = 5;w1 = 6; dp[1][5] = dp[1-1][5] + w1;
            //然后又来一个物品体积6，价值5，背包容量增加到10，10 > 6 也能放，要放的话，得把第一个物品拿掉，价值变成了5，反而小了，怎么着？ 不放呗。
            //代码就是 i = 2; v2 =6; w2 = 5; dp[2][10] = dp[2-1][10-6] + w2; 其中 dp[1][10-6] = 0；
            //然后还是这个物品，但是我的背包容量增加到了11， 11 > 6 能放，而且第一个物品还不要拿掉 价值变成了11，得放。
            //代码就是 i = 2; v2 = 6; w2 = 5; dp[2][11] = dp[2-1][11-6] + w2; 其中dp[2-1][11-6] 上面已经算过了是6 。
        }
    }
}

还有挺多变化的，遇到再整理吧。代码没有编译，不保证运行，欢迎批评指正。

写了一个复杂一些的，不贴一下，显得没有说服力。牛客网购物单问题，亲测可用：

 /**
     * 18 购物单
     * 1000 5
     * 800 2 0
     * 400 5 1
     * 300 5 1
     * 400 3 0
     * 500 2 0
     * @param args
     */
    public static void main(String[] args) {
        Scanner ac = new Scanner(System.in);
        int N = ac.nextInt() / 10;
        if(N >= 3200){
            return;
        }
        int m = ac.nextInt();
        if(m >= 60){
            return;
        }
        Goods[] goodsArr = new Goods[m+1];
        goodsArr[0] = new Goods(0,0,0); //控制初始化
        for(int i = 1; i <= m; i++){
            int v = ac.nextInt() / 10; //价格
            int p = ac.nextInt(); //重要度
            int q = ac.nextInt(); //标识
            Goods goods = new Goods(v,v*p,q);
            goodsArr[i] = goods;
        }
        for(Goods goods : goodsArr){
            if(goods.q != 0){
                //附件
                if(goodsArr[goods.q].fGoodsArr[0] == null){
                    goodsArr[goods.q].fGoodsArr[0] = goods;
                }else{
                    goodsArr[goods.q].fGoodsArr[1] = goods;
                }
            }
        }

        int[][] dp = new int[m+1][N+1];
        for(int i = 1;i <= m;i++){ //从1 开始 默认 int[0][j] = 0,意义就是一个物品也不放 满意度就是0
            for(int j = 1; j <= N; j++){ //同上，默认int[i][0] = 0,意义就是一分钱也没有，满意度就是0
                Goods curGoods = goodsArr[i];
                if(curGoods.q == 0){ //钱够买第i个物品 并且是主件
                    if(j >= curGoods.price){
                        //如要买，这是满意度，其中 dp[i-1][j-curGoods.price] 这个的意义是总钱数减去当前物品的钱数，能够购买i-1个物品的最大满意度
                        //比如我有1000 快需要再买一个400块的东西，满意度应该是 600块能够购买的最大满意度减伤当前物品的满意度， 动态规划 600的已经算过了 直接拿来用
                        int myd = dp[i-1][j-curGoods.price]+curGoods.myd;
                        dp[i][j] = Math.max(dp[i-1][j],myd);
                    }

                    if(curGoods.fGoodsArr[0] != null && i >= 2){
                        //有附件
                        int price = curGoods.price + curGoods.fGoodsArr[0].price;
                        if(j >= price){
                            dp[i][j] = Math.max(dp[i-1][j],dp[i-2][j-price]+ curGoods.myd+ curGoods.fGoodsArr[0].myd);
                        }
                        if(curGoods.fGoodsArr[1] != null){
                            price = curGoods.price + curGoods.fGoodsArr[1].price;
                            if(j >= price){
                                dp[i][j] = Math.max(dp[i-1][j],dp[i-2][j-price]+ curGoods.myd+ curGoods.fGoodsArr[1].myd);
                            }
                            if(i >=3){
                                price = curGoods.price + curGoods.fGoodsArr[0].price + curGoods.fGoodsArr[1].price;
                                if(j >= price){
                                    dp[i][j] = Math.max(dp[i-1][j],dp[i-3][j-price]+ curGoods.myd + curGoods.fGoodsArr[0].myd + curGoods.fGoodsArr[1].myd);
                                }
                            }
                        }
                    }
                }
            }
        }
        System.out.println(dp[m][N]*10);
    }

    static class Goods{
        int price;
        int myd;
        int q;
        Goods[] fGoodsArr = new Goods[2];
        public Goods(int price,int myd,int q){
            this.price = price;
            this.myd = myd;
            this.q = q;
        }
    }