part one:
1. 哈夫曼树是带权路径长度最短的树,路径上权值较大的结点离根较近. True
2. 一棵哈夫曼树的带权路径长度等于其中所有叶结点的带权路径长度之和 True
3. (后序线索树)的遍历仍需要栈的支持
A : 前序遍历(中左右)、中序遍历(左中右)的最后访问的节点都是左或右叶节点, 叶节点是没有子树的,所以两个指针域空出来了,可以存放线索指针用于回溯。但是后续遍历(左右中),最后访问的是子树的根节点,子树根节点的两个指针域都指向子树了,所以不能空出来存放线索信息,只能借助栈存储。
4.一棵哈夫曼树共有215个结点,对其进行哈夫曼编码,共能得到(108)个不同的码字
A:哈夫曼树并不是满二叉树,是正则二叉树(也叫正规二叉树),即其中只有度为0和度为2的结点 因为n0 = n2 + 1,n = n0 + n2; 所以 n = 2n0 - 1,即n0 = (n + 1) / 2;叶子结点n0对应的即是不同的编码。 至于满二叉树当然也是正则二叉树的特例。
5.在ASC算法team日常开发中,常常面临一些数据结构的抉择,令人纠结。目前大家在策划一个FBI项目(Fast Binary Indexing),其中用到的词汇有6200条,词汇长度在10-15之间,词汇字符是英文字母,区分大小写。请在下面几个数据结构中选择一个使检索速度最快的:TRIE树,寻找子节点开销:1次运算/每字符
A:注解:又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希表高。
6.在存储对称矩阵时,为了节省空间,通常可以用一个数组以行优先方式只存储上三角阵来实现。请问如果一个100*100的矩阵用上述方法来实现存储,在原矩阵中位置为选项中哪一项的元素可以通过访问数组下标为2017的位置来获得?( )数组和矩阵下标均从0开始。 (70,22)
A:
7.
Hadoop的三种运行模式 :
1.独立(本地)运行模式:无需任何守护进程,所有的程序都运行在同一个JVM上执行。在独立模式下调试MR程序非常高效方便。所以一般该模式主要是在学习或者开发阶段调试使用 。
2.伪分布式模式: Hadoop守护进程运行在本地机器上,模拟一个小规模的集群,换句话说,可以配