动态规划最优二叉树

最优二叉搜索树(动态规划)

(2010-04-29 21:44:28)
标签:

杂谈

 

来自:http://icymarywei.blog.163.com/blog/static/1275081022009921102253952/

1,问题描述:给定一个有序序列K={k1<k2<k3<,……,<kn}和他们被查询的概率P={p1,p2,p3,……,pn},要求构造一棵二叉查找树T,使得查询所有元素的总的代价最小。对于一个搜索树,当搜索的元素在树内时,表示搜索成功。当不在树内时,表示搜索失败,用一个“虚叶子节点”来标示搜索失败的情况,因此需要n+1个虚叶子节点{d0<d1<……<dn}。其中d0表示搜索元素小于k1的失败结果,dn表示搜索元素大于kn的失败情况。di(0<i<n)表示搜索节点在ki和k(i+1)之间时的失败情况。对于应di的概率序列是Q={q0,q1,……,qn}。

2,问题分析:

在二叉树中T内搜索一次的期望代价为:

E[T]=

         (depth(ki)+1)*pi  //对每个i=1~n,搜索成功情况

       +(depth(di)+1)*qi //对每个i=0~n,搜索失败情况

3,问题求解:动态规划

步骤一:寻找最优子结构。

一个最优二叉树的子树必定包含连续范围的关键字ki~kj,1<=i<=j<=n,同时也必须含有连续的虚叶子节点di-1~dj。

如果一棵最优二叉查找树T有一棵含有关键字ki~kj的子树T',那么,T'也是一棵最优查找树,这通过剪贴思想可以证明。

现在开始构造最优子结构:在ki~kj中,选定一个r,i<=r<=j,使以kr为根,ki~k(r-1)和k(r+1)~kj为左右孩子的最优二叉树。注意r=i或者r=j的情况,表示左子树或右子树只有虚叶子节点。

步骤二:一个递归解。

定义e[i,j]为一棵包含关键字ki~kj的最优二叉树的期望代价。当j=i-1时没有真实的关键在,只有虚叶子节点d(i-1)。

于是:

当j=i-1时,e[i,i-1]=q(i-1)。

当j>=i时,需要选择合适的kr作为根节点,然后其余节点ki~K(r-1)和k(r+1)~kj构造左右孩子。这时要考虑左右孩子这些节点成为一个节点的子树后,它的搜索代价的变化:根据E[T]的计算,得知它们的期望代价增加了“子树中所有概率的总和”w。

w[i,j]=

          pl // 对每个l=i~j

        +ql //对每个l=i-1~j

于是当j>=i时,e[i,j]=pr + (e[i,r-1]+w[i,r-1])+(e[r+1,j]+w[r+1,j]) = e[i,r-1] + e[r+1,j]+w[i,j];

步骤三:计算最优二叉树的期望代价

e[i,j]=

          q(i-1)  //如果j=i-1

          min(e[i,r-1] + e[r+1,j]+w[i,j]),如果i<=j,其中i<=r<=j

w[i,j] =

           q(i-1) 如果j=i-1

            w[i,j]=w[i,j-1]+pj+qj 如果i<=j

实现代码如下:

view plaincopy to clipboardprint?
1 #include <iostream>  
2 using namespace std;  
  
4 #define MAXNUM 100  
5 #define MAX 65536  
6 //p中为有序关键字k1到k5的搜索概率,k1<k2<k3<k4<k5  
7 double p[MAXNUM] = {0.00,0.15,0.10,0.05,0.10,0.20};  
8 double q[MAXNUM] = {0.05,0.10,0.05,0.05,0.05,0.10};  
9 void optimal_bst(double e[][MAXNUM],int root[][MAXNUM],double w[][MAXNUM],int n)  
10 {  
11         int i =0,j=0;  
12         //针对左或右孩子为空树情况初始化  
13         for(i = 1;i<=n+1;i++)  
14         
15                 e[i][i-1] = q[i-1];  
16                 w[i][i-1] = q[i-1];  
17         
18         int l = 0;  
19         //计算顺序如下:根据计算式:e[i,j] = e[i,r-1]+e[r+1,j  
             首先计算节点个数为1的最优二叉树的代价e[1,1],e[2,2]……  
             接着计算节点个数为1的最优二叉树的代价e[1,2],e[2,3]……  
             ……  
             最后计算结点个数为n的最优二叉树的代价e[1,n],利用之前保存的较少结点最优二叉树的结果。  
20         for(l = 1;l<=n;l++)  
21         
22                 for(i = 1;i<=n-l+1;i++)  
23                 
24                         j = i+l-1;  
25                         e[i][j] = MAX;  
26                         w[i][j] = w[i][j-1] + p[j]+q[j];  
27                         for(int r = i;r<=j;r++)  
28                         
29                                 double t = 0;  
30                                 t = e[i][r-1]+e[r+1][j] + w[i][j];  
31                                 if(t<e[i][j])  
32                                 
33                                         e[i][j]= t;  
34                                         root[i][j] = r;  
35                                 
36                         
37   
38                 
39         
40   
41 }  
42 int main()  
43 {  
44         double e[MAXNUM][MAXNUM];  
45         int root[MAXNUM][MAXNUM];  
46         double w[MAXNUM][MAXNUM];  
47   
48         optimal_bst(e,root,w,5);  
49   
50         for(int i =1;i<=6;i++)  
51         
52                 for(int j = 0;j<=5;j++)  
53                 
54                         cout << e[i][j] << "  ";  
55                 
56                 cout << endl;  
57         
58 }

### 动态规划求解最优二叉树搜索算法实现与解释 #### 定义问题 在构建最优二叉查找树时,目标是最小化平均查找成本。假设给定一组关键字`k1, k2,..., kn`以及对应的访问概率`p1, p2,..., pn`,还有失败节点(即不在集合中的键)的概率`q0,q1,...qn`。这里`qi`表示落在区间`(ki−1, ki)`内的查询比例。 #### 状态定义 设`C[i][j]`代表由第`i`到第`j`个关键词构成的最佳BST的成本;对于任意一对索引`i≤ j`,存在: \[ C[i][j]=\min_{r=i}^{j}\left(\sum _{l=i}^{j}{P(l)}+\sum _{m=0}^{i-1}{Q(m)}+\sum _{n=j}^{N}{Q(n)}+C[i][r-1]+C[r+1][j]\right)\] 其中`P(l)`是成功匹配的关键字权重之和,而`Q(m)`则是未命中情况下的权值总和[^1]。 #### 初始化条件 当只有一个元素时,其作为根节点形成的子树成本等于自身的频率加上左侧外部路径上的虚结点频率: \[ C[i][i]= P(i)+ Q(i-1), \quad i = 1,\ldots,n \] 边界情况下,如果不存在任何实际的数据项,则仅考虑两个虚拟叶子之间的开销: \[ C[i][i-1]= Q(i-1), \quad i = 1,\ldots,n \] #### 迭代计算过程 通过自底向上的方式填充表格,每次增加一个额外的层直到覆盖整个输入序列范围为止。具体来说就是先处理长度较短的连续片段再逐步扩展至更长的部分。 ```java public static void OBST(double[] p, double[] q, int n){ // Initialize cost table and root tracking array. double[][] c = new double[n + 1][n + 1]; int[][] root = new int[n + 1][n + 1]; for (int i = 0; i <= n; ++i) { c[i][i - 1] = q[i - 1]; // Boundary condition initialization } for (int l = 1; l <= n; ++l){ // Length of current segment being processed for (int i = 1; i <= n - l + 1; ++i){ int j = i + l - 1; c[i][j] = Double.MAX_VALUE; for (int r = i; r <= j; ++r){ double t = c[i][r - 1] + c[r + 1][j] + sum(p, q, i, j); if(t < c[i][j]){ c[i][j] = t; root[i][j] = r; } } } } } private static double sum(double[] p, double[] q, int start, int end){ double s = 0.0; for(int i=start;i<=end;++i)s+=p[i-1]; for(int m=0;m<start-1;++m)s+=q[m]; for(int n=end;n<p.length;++n)s+=q[n]; return s; } ``` 此代码实现了上述描述的过程,并记录下了每个阶段所选最佳根的位置以便后续重建完整的结构图。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值