项目名称:电信日志分析系统
项目描述:电信日志分析系统是以电信用户上网所产生的数据进行分析和统计计算,数据主要来源于用户的上网产生的访问日志和安全日志,通过Hadoop大数据平台完成日志的入库,处理,查询,实时分析,上报等功能,达到异常IP的检测,关键词过滤,违法违规用户的处理等,整个项目数据量在1T-20T左右,集群数量在10台到100台。
项目架构分析:
*数据采集层:ftp scoket方式
*数据存储层:HDFS
*数据分析层:MR/HIVE/IMPALA/Spark
*机器学习层:在大数据处理后的应用
*数据展示层:Oracla+SSM

思维导图:

