一、前言
这里“遗忘”不是笔误,这个系列要讲的“遗忘算法”,是以牛顿冷却公式模拟遗忘为基础、用于自然语言处理(NLP)的一类方法的统称,而不是大名鼎鼎的“遗传算法”!
在“遗忘”这条非主流自然语言处理路上,不知不觉已经摸索了三年有余,遗忘算法也算略成体系,虽然仍觉时机未到,还是决定先停一下,将脑中所积梳理成文,交由NLP的同好们点评交流。
曾与前总编刘江有过一面之缘,竟能围绕遗忘这个算法相谈甚欢,回想起来极是难得,本系列文章、基础算法源码、演示程序都将在优快云首发,算是一些纪念吧。
二、遗忘算法原理

本文介绍了一种以牛顿冷却公式为基础的遗忘算法,用于自然语言处理。该算法能发现和保留相对稳定周期性重现的事物,如词、词与词的关联。已实现的功能包括大规模语料词库生成、分词、词权值计算和共现词典生成,适用于各种语言和领域。
最低0.47元/天 解锁文章
2195

被折叠的 条评论
为什么被折叠?



