
trie
文章平均质量分 80
lhf1985314
这个作者很懒,什么都没留下…
展开
-
【转】 trie树、B树、B-树、B+树、B*树
红黑树rbtree 二叉排序树 map 就是采用红黑树存储的,红黑树(RB Tree)是平衡二叉树,其优点就是树到叶子节点深度一致,查找的效率也就一样,为logN.在实行查找,插入,删除的效率都一致,而当是全部静态数据时,没有太多优势,可能采用hash表各合适。 hash_m转载 2011-09-14 10:55:12 · 449 阅读 · 0 评论 -
双数组trie原理
一、 基本构造 Trie树是搜索树的一种,来自英文单词"Retrieval"的简写,可以建立有效的数据检索组织结构,是中文匹配分词算法中词典的一种常见实现。它本质上是一个确定的有限状态自动机(DFA),每个节点代表自动机的一个状态。在词典中这此状态包括"词前缀","已成词"等。转载 2011-09-15 11:28:11 · 953 阅读 · 0 评论 -
利用tree匹配user_agent
利用trietree树结构,使其匹配过程可以在O(n)内搞定 #ifndef MATCH_USER_AGENT_H_ #define MATCH_USER_AGENT_H_ #include #include using std::string; u原创 2011-08-25 17:23:17 · 408 阅读 · 0 评论 -
双数组trie
由于前面写的朴素bayes分类器,针对英文文本进行统计分析的,现在要想用于中文文本,则需要对中文文本进行分词。找了好几个分词系统,比如张华平老师的ICTCLAS、吕震宇老师用c#改写的ICTCLAS版本、KTDictSeg分词系统V1.3.01和清华王小飞写的双数组trie树中文转载 2011-09-15 10:48:46 · 2767 阅读 · 0 评论