- 博客(3)
- 资源 (3)
- 收藏
- 关注
原创 Java 实现文章汉字关键词(违禁词)识别2.0
说明:2.0相对1.0的算法改进 首先1.0是用父子节点树来保存树的,一个父对应多个子节点,这就不可避免要使用List来保存子节点,由于List的大小有限制,在1.0的时候加载的数据小于10万条,没有出现List溢出问题。 所以2.0放弃使用父子节点的树,在数据结构上使用了兄弟节点树,也放弃使用List树解决了List溢出问题同时效率与空间的利用提升了一个等级1.面向应用 最近公司新
2016-03-29 16:54:56
4439
原创 Java 实现文章汉字关键词(违禁词)识别1.0
1.面向应用 最近公司新开发的电商平台,要实现一些违禁词过滤。需求很简单,就是从数据库中读取内容,包括资讯,产品,公司简介之类,看看是否存在违禁词,有的话就把这条记录的ID存入违禁词文档。可以应用于分词库匹配检索,如关键字、敏感词的标识,起到过滤的作用。 2.设计思想 采用了哈希表与树相结合的思想,哈希表中放的是关键词的首字符相同和以该首字符开始的树根节点。 3.方案的优缺点
2016-03-24 16:24:47
1229
原创 关于智能时代革命性产品的构想--虚拟机器人
这是我的第一篇技术博客,纯粹个人编程经验与对未来虚拟机器人也就是人工智能的思考,多有不足,不吝赐教。关于未来只有一个概念能延续到下个世纪都不过时那就是智能,智能的发展必然与社会经济的发展联系起来,科技创造更广阔的生产力,生产力的发展带来的是科技的进步。人工智能未来分为三个阶段:智能家居、智能交通、智能机器人。要预见未来的技术,必然结合资本运营的规律,以史为鉴,当一样商品被广泛使用时便具有经济价值,
2016-01-08 23:45:51
597
Java 实现文章汉字关键词(违禁词)识别
2016-03-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人