学习使用字典树(JAVA)

本文介绍字典树(Trie树)的概念、特点及其在文本词频统计中的应用。通过实例演示如何使用字典树高效地进行字符串操作与查询。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

字典树 又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来节约存储空间,最大限度地减少无谓的字符串比较,查询效率比哈希表高。

它有3个基本特性:
  1)根节点不包含字符,除根节点外每一个节点都只包含一个字符。
  2)从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
  3)每个节点的所有子节点包含的字符都不相同。
[img]http://dl.iteye.com/upload/attachment/0076/9353/290c8d88-3821-3875-b4b1-a1f010221258.gif[/img]

如用 ak ab ab ai oricon orish 所构造出来的字典树为:
[img]http://dl.iteye.com/upload/attachment/0076/9357/3d965fe5-d271-3df2-848d-0fa02391c7d4.gif[/img]

例: POJ2001,题目大意:
给你很多个字符串,让你找每个字符串的最短前缀,但这么多字符串前缀不能有相同的,要能唯一标识一个字符串,而且前缀长度尽量小。

样例:
Sample Input

carbohydrate
cart
carburetor
caramel
caribou
carbonic
cartilage
carbon
carriage
carton
car
carbonate

Sample Output

carbohydrate carboh
cart cart
carburetor carbu
caramel cara
caribou cari
carbonic carboni
cartilage carti
carbon carbon
carriage carr
carton carto
car car
carbonate carbona

AC 代码:
import java.util.Scanner;
import java.util.List;
import java.util.ArrayList;

public class Main{
private int SIZE = 26;
private TrieNode root; //字典树的根
private List<String> l=new ArrayList<String>();


public Main() { //初始化字典树
root = new TrieNode();

}

private class TrieNode { //字典树节点
private int num;//有多少字符通过这个节点.
private TrieNode[] son;// 所有的儿子节点
private boolean isEnd;//是不是最后一个节点
private char val;// 节点的值


TrieNode() {
num = 1;
son = new TrieNode[SIZE];
isEnd = false;

}
}

public void insert(String str) { //在字典树中插入一个单词
if (str == null || str.length() == 0) {
return;
}
TrieNode node = root;
char[] letters=str.toCharArray();
for (int i = 0, len = str.length(); i < len; i++) {
int pos = letters[i] - 'a';
if (node.son[pos] == null) {
node.son[pos] = new TrieNode();
node.son[pos].val = letters[i];
} else {
node.son[pos].num++;
}
node = node.son[pos];
}
node.isEnd = true;
}

// 在字典树中查找.
public void search(String str) {
if (str == null || str.length() == 0) {
return ;
}
TrieNode node = root;
char[] letters=str.toCharArray();
for (int i = 0, len = str.length(); i < len; i++) {
int pos = letters[i] - 'a';
System.out.printf("%c",letters[i]);
node=node.son[pos];
if( node.num==1)
break;;
}
}


private void go() {

Scanner in = new Scanner(System.in);
String s=null;
int num=0;
while(in.hasNext()){

s=in.next();
l.add(s);
insert(s);
num ++;
}


for(int i = 0; i < num; i++){
System.out.printf("%s ",l.get(i));
search(l.get(i));
System.out.println();
}

}

public static void main(String[] args) {

Main ma=new Main();
ma.go();

}
}



后记:
题目虽然在北大PKU上AC了(说明解答没有错),但在自己电脑上DOS下运行时不能输出答案,问题在下面这段代码:(不然跳出循环)

 Scanner in = new Scanner(System.in); 
String s=null;
int num=0;
while(in.hasNext()){

s=in.next();
l.add(s);
insert(s);
num ++;
}


网上也没有找到答案,到底如何处理本题的输入,请各位提出,谢谢!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值