8、大数据采集与处理:Nutch、Solr、Gora、HBase及MapReduce实践

大数据采集与处理:Nutch、Solr、Gora、HBase及MapReduce实践

1. 数据采集:Nutch与HBase配置

在使用Nutch进行数据采集前,需确保HBase正常运行并将数据存储到HDFS。可使用Hadoop文件系统的 ls 命令进行检查:

[hadoop@hc1nn logs]$ hadoop dfs -ls /hbase

示例输出如下:

Found 5 items
drwxr-xr-x   - hadoop supergroup          0 2014-04-12 19:55 /hbase/-ROOT-
drwxr-xr-x   - hadoop supergroup          0 2014-04-12 19:55 /hbase/.META.
drwxr-xr-x   - hadoop supergroup          0 2014-04-12 19:57 /hbase/.logs
drwxr-xr-x   - hadoop supergroup          0 2014-04-12 19:57 /hbase/.oldlogs
-rw-r--r--   3 hadoop supergroup          3 2014-04-12 19:55 /hbase/hbase.version
2. Gora配置

Gora可让Nutch选择数据存储位置,支持多种数据存储。以下是配置G

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值