使用mapreduce清洗web访问日志并导入hive数据库流程
编写一个简单的日志清洗脚本,原始访问日志如下:192.168.18.1 - - [16/Feb/2017:13:53:49 +0800] "GET /favicon.ico HTTP/1.1" 404 288192.168.18.2 - - [16/Feb/2017:13:53:49 +0800] "GET /鞋子/男鞋/运动鞋/a001 HTTP/1.1" 404 288192.168.18...
原创
2018-06-12 14:13:32 ·
2646 阅读 ·
0 评论