AC多模匹配算法过滤敏感词实例

本文介绍了如何使用AC多模匹配算法在大数据场景下高效地过滤敏感词。通过创建应用类并进行测试,展示了该算法在性能和匹配度上的优势。在Java Web项目中,可以引入AhoCorasick类来实现这一功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文章摘编、转载需要注明来源 http://blog.youkuaiyun.com/shadowsick/article/details/8891939

在应用项目中很多时候都需要用到过滤敏感词的功能,自己写个遍历明显在小数据的时候还能凑合下,但是对于大数据的时候就有点力不从心了,这里推荐使用ac多模匹配算法


先来写个应用类

/**
 * AC多模匹配敏感字符工具类实现类
 * 
 * @author shadow
 * @email 124010356@qq.com
 * @create 2012.04.28
 */
public class AcUtilImpl implements AcUtil {

	public String contrast(String filters, String word, String regex) {

		if (null == filters || "".equals(filters) || null == word
				|| "".equals(word))
			return "";

		AhoCorasick ac = new AhoCorasick();
		String[] strings = StringUtils.split(filters, regex);
		for (String string : strings)
			ac.add(string.getBytes(), string);
		ac.prepare();
		return matching(ac, word);
	}

	public String contrast(String[] filters, String word) {

		if (null == filters || filters.length <= 0 || null == word
				|| "".equals(word))
			return "";

		AhoCorasick
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值