
自然语言处理
文章平均质量分 67
daisyZH
微博:http://weibo.com/daisyzhuan
展开
-
关于搜索提示功能的实现
转自:http://wubin850219.iteye.com/blog/516418/** * *作者:野四abin * 时间:2009-3-27 */ 搜索引擎现在越来越流行了,好多网站都有了自己的搜索引擎,但是对于类似GOOGLE的提示并不多,在我的印象中并没有太多(google,baidu.todou,youku…),而大多数都是转载 2013-01-04 09:35:36 · 821 阅读 · 0 评论 -
网页搜索中查询纠错概述
转自:http://blog.youkuaiyun.com/oanqoanq/article/details/70045301. 背景介绍 搜索引擎的输入查询中,有相当一部分是带输入错误的查询。而提交有错误的查询给搜索引擎,通常得不到好的搜索结果,返回结果数很少并且和用户的期待相差很远,会严重影响了用户的使用体验。 如:转载 2013-01-04 09:43:52 · 2139 阅读 · 0 评论 -
搜索引擎的拼写纠错功能实现
转自:http://blog.sina.com.cn/s/blog_567842410100obxd.html现在各大流行的搜索引擎几乎都具备一个功能,那就是提供拼写纠错功能。用户将查询的关键词提交给搜索引擎之后,搜索引擎便开始分析用户的输入,检查用户的拼写是否有错误,如果有的话,给出正确的拼写建议。也就是说,搜索引擎的拼写纠错功能,要完成两部分的工作,首先,对用户输入的查询进行处理,判断转载 2013-01-04 09:45:31 · 5567 阅读 · 0 评论 -
向量空间模型
向量空间模型(VSM:Vector Space Model)由Salton等人于20世纪70年代提出,并成功地应用于著名的SMART文本检索系统。VSM概念简单,把对文本内容的处理简化为向量空间中的向量运算,并且它以空间上的相似度表达语义的相似度,直观易懂。当文档被表示为文档空间的向量,就可以通过计算向量之间的相似性来度量文档间的相似性。文本处理中最常用的相似性度量方式是余弦距离。转载 2013-04-27 10:33:51 · 1015 阅读 · 0 评论 -
输入法中统计语言模型的建立以及平滑
转自:http://blog.qq.com/qzone/95007909/1274760124.htm目前正在编写手机平台上的输入法,在输入法中要向实现句子级别的智能输入,必须借助统计语言模型,依靠统计语言模型中的词概率值,输出最可能的句子。下面将介绍统计语言模型的建立以及平滑。目前输入法中常用的语言模型有trigram(三元)和bigram(二元),其中微软拼音、智能狂拼使用转载 2013-05-29 14:43:40 · 2533 阅读 · 0 评论