
大数据
文章平均质量分 89
软件工程小施同学
区块链、DevOps、小程序、软件工程
展开
-
spark入门(1)
Spark是什么?既然设置好了Spark,现在我们讨论下Spark是什么。Spark是个通用的集群计算框架,通过将大量数据集计算任务分配到多台计算机上,提供高效内存计算。如果你熟悉Hadoop,那么你知道分布式计算框架要解决两个问题:如何分发数据和如何分发计算。Hadoop使用HDFS来解决分布式数据问题,MapReduce计算范式提供有效的分布式计算。类似的,Spark拥有多种语言的函数转载 2016-09-25 18:52:22 · 610 阅读 · 0 评论 -
基于Spark+Redis的实时可视分析探究
及“跑步点亮北京”的可视项目设计目录1.引言2.大数据采集2.1.大数据特征2.2.采集方式“跑步点亮北京”的数据采集方式2.3.存储方式a)Hadoop(HDFS)b)Redis内存数据库(Geo)2.4数据处理(1) HDFS 列表(2)数据添加(3) 数据清洗(原创 2016-09-25 19:03:46 · 5859 阅读 · 0 评论 -
A small instance of visual analytics basing Spark(Python)
A small instance of visual analyticsbasing Spark(Python)The total delay time of the major airlines in a certain month1.Preparation1.1.Data This data set was downlo原创 2016-09-25 19:06:53 · 624 阅读 · 0 评论