
自然语言处理
文章平均质量分 88
_lichaoxi
javaWeb
展开
-
问答系统(QA)1—基于词典的正向最大匹配算法
转载:杨尚川 地址:http://yangshangchuan.iteye.com/blog/2031813 内容有修改 基于词典的正向最大匹配算法(最长词优先匹配),算法会根据词典文件自动调整最大长度,分词的好坏完全取决于词典。 算法流程图如下: Java实现代码如下: package nlp.segmentation; import java.io.IOException转载 2016-12-01 11:06:03 · 4463 阅读 · 0 评论 -
问答系统(QA)0
现有的检索系统,无论是受限领域的检索还是互联网搜索引擎,一般都是基于关键字检索(1.相关答案多2.意图表达差3.语言层,未触及语义层)。 Frequently Asked Questions,FAQ,即通过提取问题特征进行相似度计算来返回排序后的答案, 问题解析:主要包括分词、词性标注、句法分析、命名实体识别、问题分类、问题扩展等。 分词:中英文分词存在很大的区别,英文单词之间是以空格作原创 2016-11-23 12:09:22 · 14896 阅读 · 4 评论