
Semantic Web
ccwwff
这个作者很懒,什么都没留下…
展开
-
数学之美系列二十:自然语言处理的教父 马库斯
我们在前面的系列中介绍和提到了一些年轻有为的科学家,迈克尔·柯林斯,艾里克·布莱尔,大卫·雅让斯基,拉纳帕提等等,他们都出自宾夕法尼亚计算机系米奇·马库斯(Mitch Marcus)名下。就像许多武侠小说中描写的,弟子都成了各派的掌门,师傅一定了不得。的确,马库斯虽然作为第一作者发表的论文并不多,但是从很多角度上讲,他可以说是自然语言处理领域的教父。马库斯教授长期当任宾夕法尼亚大学计算机系转载 2015-08-14 16:37:35 · 1453 阅读 · 0 评论 -
c++ 中文分词介绍
from: http://blog.youkuaiyun.com/zhulinu/article/details/8630360 本文不是专业的介绍中文的知识,只是由于项目上可能需要中文分词,在网上找了一些资料,再次记录一下。主要参考网站是oschina里面收录的内容:中科院中文分词 ICTCLAS这个据说效率挺高,但不是纯开源版本,里面有个文章12年7月1日失效,就是由于授权协议转载 2015-08-21 15:18:30 · 1556 阅读 · 0 评论 -
Chinese Language Processing at Penn -- 中文宾大TreeBank
From: http://www.cis.upenn.edu/~chinese/Penn's Chinese Language Processing program is anchored by linguistic corpora annotated with morphological, syntactic, semantic and discourse structures. The P翻译 2015-09-07 02:29:25 · 3612 阅读 · 0 评论 -
TF-IDF算法-Python实现(附源代码)
From: http://blog.youkuaiyun.com/zhb_bupt/article/details/40985831一、背景 TF-IDF算法全称 termfrequency–inverse document frequency,是一种用于资讯检索与资讯探勘的常用加权技术。它的算法复杂度并不高,但能很好的满足搜索高相关度文档的需转载 2015-10-05 15:01:42 · 15262 阅读 · 2 评论