- 博客(4)
- 收藏
- 关注
原创 献给热衷于自然语言处理的业余爱好者的中文新闻分类语料库之二(转载)
原文地址:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html免责声明:此语料库仅供自然语言处理的业余爱好者研究和交流,禁止用于任何商业用途(包括在资源内部链接广告等行为)。感谢网易新闻中心、腾讯新闻中心、凤凰新闻中心以及新浪新闻中心提供新闻素材。新闻著作权归以上网站所有,任何人未经上述公司允许不得抄袭。...
2010-10-04 13:52:20
223
原创 献给热衷于自然语言处理的业余爱好者的中文新闻分类语料库之一(转载)
原文地址:http://www.cnblogs.com/finallyliuyu/archive/2010/09/10/1823676.html 题记: 做研究,尤其是基于统计学方法的研究,常常需要大量的训练数据。详细这些东西在读研究生不难得到。在自然语言处理公司工作的工作人员也不难得到。但是这些东西属于机密,实验室和公司是不会轻易外传的。所以对于业余的爱好者来说,比如园子...
2010-10-04 13:50:09
361
原创 大数据量,海量数据 处理方法总结(转载)
转载,原文地址:http://blog.sina.com.cn/s/blog_4d3a41f40100ic9d.html 不错。原文地址:大数据量,海量数据 处理方法总结(转载)作者:秋金遇水 (此转载地址现博文加密,无法看到了~)最近有点忙,稍微空闲下来,发篇总结贴。大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及...
2010-09-01 10:38:51
165
Nutch0.9安装指南
终于!我把Nutch0.9的安装文档贴出来了首先提醒的是,按照这个步骤做还是会遇到各种莫名奇妙的问题,没关系,按照步骤查找,一定有地方出错了,从出错的地方重新做吧。(连我自己每次重新安装的时候还是会遇到各种问题,所以过程一定要细心啊!) 直接上过程:1、首先,我的配置:JDK1.6,Tomcat6.0,Nutch0.92、添加JAVA_HOME和CATALINA_HO...
2010-06-07 20:38:24
271
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人