- 博客(2)
- 资源 (4)
- 收藏
- 关注
原创 eclipse中读取nutch爬取的数据内容
最近在研究Nutcha的爬虫和解析,在windows中利用cygwin执行nutch爬取网页。那么爬取到的数据如何取到自己的程序中来使用呢?参考了以下博主的内容,不过博主太懒没有任何文字描述。读取nutch爬取的数据内容http://blog.youkuaiyun.com/java_boke/article/details/7789160将上面的代码拷到自己的程序中(ecl
2015-09-22 11:41:30
800
原创 关于nutch1.2 配置到tomcat中搜索不到结果的问题解决
在官网上下了nutch1.2,配置到windows中,然后又将nutch-1.2.war配置到tomcat里。经过一系列的配置,成功爬怪到了网页内容,用命令【bin/nutch org.apache.nutch.searcher.NutchBean 关键字】可以看到爬取了多少URL,但是通过访问tomcat页面却搜索不到关键字相关的任何结果。于是查了tomcat的log日志,原来报了如
2015-09-11 10:15:10
805
hadoop-core-1.2.0.jar
2015-09-22
apache-tomcat-7.0.47-windows-x86
2015-08-25
HeidiSQL_9.2_Portable
2015-08-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人