之前在树莓派的raspbian系统上安装过Nutch1.x
http://blog.csdn.net/a897180673/article/details/78387375
后来继续学习的时候,发现nutch2.x 和1.x不一样了,改变了很多,支持Mysql了,而且Nutch2.x 需要自己编译安装,入了很多坑
先说总览:
最绝望的坑是这个
[ivy:resolve] :: Ivy 2.2.0 - 20100923230623 :: http://ant.apache.org/ivy/ ::
[ivy:resolve] :: loading settings :: file = /root/nutch2.2.1/apache-nutch-2.2.1/ivy/ivysettings.xml
一直卡在这里不动,都以为他死掉了,就在我打算快按下ctrl+C 的时候,他突然动了,差点没安装成功. 大概等3min左右才动.
然后动了 就开始跑进度条,吃过饭回来看了一下还在跑,跑完结束,下面有个提示.尼玛,35min.整个安装过程 确实挺长的.
这个还不是最坑的,我爬取数据存到Mysql数据可的时候,老是报错
ClassNotFoundException:com.mysql.jdbc.Driver
明明已经在配置文件中支持了啊,删除了重新编译还是如此,头疼
最后没办法 把连接数据库的JDBC代码 在windows上跑一遍,终于找到问题了
原来是/conf/gora.properties 配置数据库 用户名 密码 url 的时候 后面多了几个空格
巨坑,搞了一下午,才发现问题,复制下面的配置需谨慎.
参考:http://blog.youkuaiyun.com/maoersong/article/details/52201812