一.项目要求
根据电商日志文件,分析:
-
统计页面浏览量(每行记录就是一次浏览)
-
统计各个省份的浏览量 (需要解析IP)
-
日志的ETL操作(ETL:数据从来源端经过抽取(Extract)、转换(Transform)、加载(Load)至目的端的过程)
为什么要ETL:没有必要解析出所有数据,只需要解析出有价值的字段即可。本项目中需要解析出:ip、url、pageId(topicId对应的页面Id)、country、province、city。
二. 开发步骤
在idea中首先配置maven文件

随后配置pom.xml文件
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns=

最低0.47元/天 解锁文章
543

被折叠的 条评论
为什么被折叠?



