贪心算法 总结

本文深入讲解了贪心算法的基本概念、关键性质及其实现方法。通过活动安排问题、背包问题和哈夫曼编码等经典案例,阐述了如何设计和验证贪心算法的有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

贪心算法


顾名思义,贪心算法总是作出在当前看来最好的选择。也就是说贪心算法并不从整体最优考虑,它所作出的选择只是在某种意义上的局部最优选择。当然,希望贪心算法得到的最终结果也是整体最优的。虽然贪心算法不能对所有问题都得到整体最优解,但对许多问题它能产生整体最优解。如单源最短路经问题,最小生成树问题等。在一些情况下,即使贪心算法不能得到整体最优解,其最终结果却是最优解的很好近似。
个人觉得:贪心算法要比动态规划更难,因为动态规划一般是建立在一些递归之类的算法之上,加上记忆就可以达到效果。而贪心算法要考虑的东西却更多,特别是怎么证明局部最优就是全局最优。而一旦证明出来,贪心的代码则比较简单。

典型实例一、活动安排问题

问题表述:设有n个活动的集合E = {1,2,…,n},其中每个活动都要求使用同一资源,如演讲会场等,而在同一时间内只有一个活动能使用这一资源。每个活i都有一个要求使用该资源的起始时间si和一个结束时间fi,si < fi 。如果选择了活动i,则它在半开时间区间[si, fi)内占用资源。若区间[si, fi)与区间[sj, fj)不相交,则称活动i与活动j是相容的。也就是说,当si >= fjsj >= fi时,活动i与活动j相容。

由于输入的活动以其完成时间的非减序排列,所以算法greedySelector每次总是选择具有最早完成时间的相容活动加入集合A中。直观上,按这种方法选择相容活动为未安排活动留下尽可能多的时间。也就是说,该算法的贪心选择的意义是使剩余的可安排时间段极大化,以便安排尽可能多的相容活动。

算法greedySelector的效率极高。当输入的活动已按结束时间的非减序排列,算法只需O(n)的时间安排n个活动,使最多的活动能相容地使用公共资源。如果所给出的活动未按非减序排列,可以用O(nlogn)的时间重排。

例:设待安排的11个活动的开始时间和结束时间按结束时间的非减序排列如下:


算法greedySelector 的计算过程如下图所示。图中每行相应于算法的一次迭代。阴影长条表示的活动是已选入集合A的活动,而空白长条表示的活动是当前正在检查相容性的活动。


若被检查的活动i的开始时间Si小于最近选择的活动j的结束时间fi,则不选择活动i,否则选择活动i加入集合A中。 

贪心算法并不总能求得问题的整体最优解。但对于活动安排问题,贪心算法greedySelector却总能求得的整体最优解,即它最终所确定的相容活动集合A的规模最大。这个结论可以用数学归纳法证明。

它的伪代码如下:

与活动安排问题很类似的一个题目是PKU上面的 poj 1065 Wooden Sticks这道。

贪心算法的基本要素

对于一个具体的问题,怎么知道是否可用贪心算法解此问题,以及能否得到问题的最优解呢?这个问题很难给予肯定的回答。

但是,从许多可以用贪心算法求解的问题中看到这类问题一般具有2个重要的性质:贪心选择性质和最优子结构性质。

1、贪心选择性质

所谓贪心选择性质是指所求问题的整体最优解可以通过一系列局部最优的选择,即贪心选择来达到。这是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。

动态规划算法通常以自底向上的方式解各子问题,而贪心算法则通常以自顶向下的方式进行,以迭代的方式作出相继的贪心选择,每作一次贪心选择就将所求问题简化为规模更小的子问题。 

对于一个具体问题,要确定它是否具有贪心选择性质,必须证明每一步所作的贪心选择最终导致问题的整体最优解。

2、最优子结构性质

当一个问题的最优解包含其子问题的最优解时,称此问题具有最优子结构性质。问题的最优子结构性质是该问题可用动态规划算法或贪心算法求解的关键特征。 

3、贪心算法与动态规划算法的差异

贪心算法和动态规划算法都要求问题具有最优子结构性质,这是2类算法的一个共同点。但是,对于具有最优子结构的问题应该选用贪心算法还是动态规划算法求解?是否能用动态规划算法求解的问题也能用贪心算法求解?下面研究2个经典的组合优化问题,并以此说明贪心算法与动态规划算法的主要差别。

0-1背包问题:

给定n种物品和一个背包。物品i的重量是Wi,其价值为Vi,背包的容量为C。应如何选择装入背包的物品,使得装入背包中物品的总价值最大?

在选择装入背包的物品时,对每种物品i只有2种选择,即装入背包或不装入背包。不能将物品i装入背包多次,也不能只装入部分的物品i

背包问题:

0-1背包问题类似,所不同的是在选择物品i装入背包时,可以选择物品i的一部分,而不一定要全部装入背包,1 <= i <= n

2类问题都具有最优子结构性质,极为相似,但背包问题可以用贪心算法求解,而0-1背包问题却不能用贪心算法求解。

用贪心算法解背包问题的基本步骤:

首先计算每种物品单位重量的价值Vi/Wi,然后,依贪心选择策略,将尽可能多的单位重量价值最高的物品装入背包。若将这种物品全部装入背包后,背包内的物品总重量未超过C,则选择单位重量价值次高的物品并尽可能多地装入背包。依此策略一直地进行下去,直到背包装满为止。

伪代码:

void Knapsack(int n,float M,float v[],float w[],float x[])

{

  Sort(n,v,w);

  int i;

  for (i = 1 ; i <= n ; i++) 

    x[i] = 0;

    float c=M;

    for (i=1;i<=n;i++) {

      if (w[i] > c) break;

    x[i]=1;

    c-=w[i];

  }

  if (i <= n) 

    x[i]=c / w[i];

}

算法knapsack的主要计算时间在于将各种物品依其单位重量的价值从大到小排序。因此,算法的计算时间上界为 Onlogn)。

为了证明算法的正确性,还必须证明背包问题具有贪心选择性质。

对于0-1背包问题,贪心选择之所以不能得到最优解是因为在这种情况下,它无法保证最终能将背包装满,部分闲置的背包空间使每公斤背包空间的价值降低了。事实上,在考虑0-1背包问题时,应比较选择该物品和不选择该物品所导致的最终方案,然后再作出最好选择。由此就导出许多互相重叠的子问题。这正是该问题可用动态规划算法求解的另一重要特征。实际上也是如此,动态规划算法的确可以有效地解0-1背包问题。

典型实例二、 哈夫曼编码

哈夫曼编码是广泛地用于数据文件压缩的十分有效的编码方法。其压缩率通常在20%90%之间。哈夫曼编码算法用字符在文件中出现的频率表来建立一个用01串表示各字符的最优表示方式。

给出现频率高的字符较短的编码,出现频率较低的字符以较长的编码,可以大大缩短总码长。

 

a

b

c

d

e

f

频率(千次)

45

13

12

16

9

5

定长码

000

001

010

011

100

101

变长码

0

101

100

111

1101

1100

定长码:

  3*(45+13+12+16+9+5) = 300 千位

变长码:

  1*45+3*13+3*12+3*16+4*9+4*5 = 224 千位

1、前缀码

对每一个字符规定一个0,1串作为其代码,并要求任一字符的代码都不是其它字符代码的前缀。这种编码称为前缀码

编码的前缀性质可以使译码方法非常简单。 

表示最优前缀码的二叉树总是一棵完全二叉树,即树中任一结点都有2个儿子结点。

f(c)表示字符c出现的概率,dt(c)表示c的码长

平均码长定义为:

使平均码长达到最小的前缀码编码方案称为给定编码字符集C最优前缀码

2、构造哈夫曼编码

哈夫曼提出构造最优前缀码的贪心算法,由此产生的编码方案称为哈夫曼编码

哈夫曼算法以自底向上的方式构造表示最优前缀码的二叉树T

算法以|C|个叶结点开始,执行|C|1次的“合并”运算后产生最终所要求的树T。 

f为键值的优先队列Q用在贪心选择时有效地确定算法当前要合并的2棵具有最小频率的树。一旦2棵具有最小频率的树合并后,产生一棵新的树,其频率为合并的2棵树的频率之和,并将新树插入优先队列Q。经过n1次的合并后,优先队列中只剩下一棵树,即所要求的树T

算法huffmanTree用最小堆实现优先队列Q。初始化优先队列需要O(n)计算时间,由于最小堆的removeMinput运算均需O(logn)时间,n1次的合并总共需要O(nlogn)计算时间。因此,关于n个字符的哈夫曼算法的计算时间为O(nlogn) 

3、哈夫曼算法的正确性

要证明哈夫曼算法的正确性,只要证明最优前缀码问题具有贪心选择性质和最优子结构性质。

(1)贪心选择性质

(2) 最优子结构性质

更多题贪心目:
算法导论 第16章后习题
poj 1083 Moving Tables

int movetable()
{
     int t,i,j,N,P[200];
     int s,d,temp,k,min;
     cin>>t;
     for(i=0;i<t;i++)
     {
          for(j=0;j<200;j++)
               P[j]=0;
          cin>>N;
          for(j=0;j<N;j++)
          {
               cin>>s>>d;
               s=(s-1)/2;
               d=(d-1)/2;               
               if(s>d)
               { temp=s;
               s=d;
               d=temp;
               }
               for(k=s;k<=d;k++)
                    P[k]++;
          }
          min=-1;
          for(j=0;j<200;j++)
               if(P[j]>min)
                    min=P[j];
          cout<<min*10<<endl;
     }
     return 0;
参考:算法导论 第16章
         PKU解题报告

### 贪心算法的核心思想 贪心算法是一种通过逐步做出局部最优的选择来解决问题的方法,其目标是在每一步都选择当前情况下最好的选项,从而期望最终得到全局最优解[^2]。然而需要注意的是,这种策略并不总是能够保证获得真正的全局最优解,因此在应用时需谨慎验证。 #### 局部最优与整体最优的关系 贪心算法的关键在于如何定义“局部最优”。例如,在找零钱问题中,优先使用面额较大的钞票可以减少所需钞票的数量,这是一种直观的局部最优策略[^2]。但是并非所有问题都能如此简单地解决;某些复杂场景下可能需要更深入的理解才能正确设计出有效的贪心规则。 #### 学习过程中的挑战与成长 对于初学者而言,掌握贪心算法可能会遇到一定困难。正如一位学习者所描述,“刚开始都不怎么会做”,这表明初次接触此类方法时常感到困惑甚至无从下手[^1]。面对这些问题,可以通过观看在线教程、查阅参考资料以及与其他同学交流等方式逐渐积累经验并形成自己的思考模式。“慢慢地才对贪心算法有了一些规律上的总结”,说明持续的努力加上实践是非常重要的环节之一[^1]。 以下是基于C++实现的一个典型例子——跳跃游戏(Jump Game),它展示了如何利用贪心思路高效求解特定类型的问题: ```cpp #include <iostream> using namespace std; int canJump(int* nums, int size){ int lastPos = size - 1; for (int i = size - 1; i >= 0; --i){ if (i + nums[i] >= lastPos){ lastPos = i; } } return lastPos == 0 ? 1 : 0; } int main(){ int a[] = {2,3,1,1,4}; cout << canJump(a,sizeof(a)/sizeof(*a))<< endl; } ``` 此程序片段实现了这样一个功能:给定一系列非负整数表示每个位置的最大跳远距离,请判断是否可以从第一个位置出发到达最后一个位置。这里采用逆向思维的方式,不断更新最远可达到的位置直到起点为止[^3]。 ### 结论 综上所述,虽然贪心算法看似简单易懂,但在实际运用过程中仍需仔细考量各种因素以确保解决方案的有效性和准确性。随着不断的练习和探索,人们不仅可以提升对该技术的认识水平,而且还能培养良好的编程习惯和技术素养。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值