
文本分析技术
cserchen
盛大 百度 复旦 数据挖掘 推荐系统 搜索引擎 机器学习
展开
-
开源中文分词FudanNLP
推荐FudanNLP,这是一个复旦大学计算机学院开发的开源中文自然语言处理(NLP)工具包Fudan NLP里包含中文分词、关键词抽取、命名实体识别、词性标注、时间词抽取、语法分析等功能,对搜索引擎、文本分析等极为有价值。开源项目地址为:http://code原创 2011-09-28 13:43:03 · 15310 阅读 · 2 评论 -
解析UTF8字符串,并截取每个字符到vector(C++代码)
C++小函数,从给定string中,解析编码并获取每一个字符例如 string=“游历德国:萨尔河畔-德国Saarbrucken 风景壁纸”解析后的vector,每个字符被解析出来,成为:“游/历/德/国/:/萨/尔/河/畔/-/德/国/S/a/a/r/b/r/u/c/k/e/n/ /风/景/壁/纸”代码分析如下=======================原创 2012-01-15 00:13:06 · 3650 阅读 · 0 评论 -
机器学习资源大全
推荐!国外程序员整理的机器学习资源大全本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操转载 2014-08-25 18:57:31 · 4143 阅读 · 0 评论 -
很高兴获得了CIKM Competition数据挖掘竞赛的冠军
再次证明了我们团队在算法研发方面的一流水准!关于CIKM Competition比赛的介绍和我们所使用的方法,原创 2014-11-23 20:14:10 · 4765 阅读 · 2 评论