对于国内互联网和出版物来说,屏蔽敏感词和某些众所周知的秘密是一件老生常谈加司空见惯的事情了。。。上周小白也做了一个这个功能,但是我们属于游戏,要屏蔽的东西十分简单,不用像那些大型网站或者平台一样用专门的算法进行匹配,所以就能省则省。。。但是还是想说蛋疼的模式匹配啊
1,普通匹配法
该方法就是直接进行字符匹配,遍历所有的敏感词列表看看用户的输入中是否有敏感词出现,这种对敏感词少且输入短的来说是无所谓,但是真正的应用,我只能说:呵呵。。。
2,正则匹配
我也觉得正则匹配用到此处刚刚好,完全可以担当灵活多变四个字。但是如果是匹配有某些规律的还好说,可敏感词我还真找不出来他都是什么规律,想了想,无奈的放弃吧,当断则断
3,字典树
从运营处拿到了两份敏感词,一份是名字,一份是聊天,其中名字有一万行,聊天也特么有一万多行。使用过普通匹配后,猛喷出一口老血,这酸爽。。。无奈,使用了字典树,具体步骤是:a,预先遍历敏感词,构造字典树;b,根据输入匹配。貌似说了一堆废话。。。(其实我也不想,是现在闲了

这篇博客介绍了在游戏场景下如何处理敏感词过滤,对比了普通匹配法和正则匹配的局限性,最终选择了使用字典树的方法。通过预先构建字典树并匹配用户输入,提升了匹配效率。文章提供了字典树的实现思路和代码片段。
最低0.47元/天 解锁文章
804

被折叠的 条评论
为什么被折叠?



