
算法
phyeas
乐观...安静..
展开
-
试析从LR(0)生成DFA及移动-规约过程分析
参考《编译原理及实践》 有如下文法:A→(A)|a 先给出该文法的DFA: 根据规定,将A'→A作为开始。 得到文法: A'→A A→(A)|a ----------------- 根据从左到右扫描,虚拟一个游标。当前游标在-1处,即: A'→A ↑(在A前面) 让游标向右移动(第一次移动)。得到 A'→A ↑(在A后面) 但由于A是一个可...2009-09-16 23:16:58 · 870 阅读 · 0 评论 -
分词器源码……M1
事实上要自己写的代码很少。我写了四个类。都在org,phyeas包内,其他代码没有改过。目前测试的结果是: 速度:104k/s f-score:0.938 ---------------------- 测试平台: 系统:Ubuntu9.10 CPU:P43.06 内存:1G+512M Eclipse:3.4 在Windows下可能会有错误原因可能是字符集不一样,我Ub...2010-04-15 11:00:43 · 152 阅读 · 0 评论 -
γ code及其实现
1. What is γ code? γ编码并不是我随便乱取的名字,其原理在信息检索导论第5章第3节有介绍,用于压缩一连串有序的数字类型的数据非常有用。在MG中将γ编码归类为全局模型(MG更推崇局部模型)。其原理是将所有的数据分成两部分连起来,第一部分为数据长度,第二部分为数据内容。这样做的好处是对于很小的数字γ编码可以只用bit就可以表示了,如对于8这样的数字,只需要表示数据长度的111...2010-10-01 01:56:07 · 639 阅读 · 0 评论 -
寻找二叉树最优路径
一个用数组表示的二叉树int[] tree=new int[]{7,5,46,1,8,9,36...};,根节点为7,下面俩子节点分别是5和46,以此类推产生其他子节点。现在需要找出该二叉树所有节点之和最大的路径。 首先想到的是将该数组变成一个树形结构的数据再遍历该树节点值相加,得到最后结果最大的叶子节点,再回溯到根节点得到路径,但这样耗费太多空间资源。每个节点需要存储其本身的值,然...2010-10-26 00:45:47 · 902 阅读 · 0 评论