相关参考: 大数据处理基本过程 浅谈大数据处理 为了获得更准确或者更有价值的信息,我们不得不对海量的原始数据进行处理。因此便出现了想hadoop、spark这样的分布式处理框架。在这些平台上面处理可以加快数据分析的速度。 一、 数据采集: 通过编写爬虫程序等手段获取所需数据 二、数据清洗: 通过编写脚本等手段清洗用户数据 三、数据分析: -统计分析、预测模型设计与实现等 四、数据呈现: 日常报表设计与优化