
课本学习
中关村一男子
这个作者很懒,什么都没留下…
展开
-
spagoBI中文文档
SpagoBI是唯一100%的开源商业智能套件由 Engineering Group的SpagoBI实验室(www.eng.it)开发和管理。它提供了强大的分析能力,从传统的报表和图表功能到自助分析、地理位置分析,What-If分析和社交网络分析等新兴领域的创新解决方案,号称开源BI领袖。通过SpagoBI项目的实施在企业日常经营管理活动中为您的经营决策提供辅助支持;发展历程10年转载 2017-02-08 16:27:58 · 10139 阅读 · 0 评论 -
深入浅出大数据--课本学习 one
深入浅出大数据–课本学习寒假期间完成学习此书大数据概述大数据关键技术基于Hadoop的生态系统分布式文件系统HDFS分布式计算框架MapReduce资源管理框架分布式存储数据库HBase数据仓库Hive数据分析与挖掘Mahout大数据应用大数据概述1.1 大数据发展历程Big Data 早在2008年就有研究人员对这一领域开始研究。近几年发展迅猛,是IT技术发展到一定阶段的必然原创 2017-01-20 16:09:26 · 609 阅读 · 0 评论 -
深入浅出大数据–课本学习 two
大数据关键技术大数据技术包括大数据采集与预处理,大数据存储与管理,大数据分析与挖掘,大数据应用与展现。大数据采集与预处理这是大数据价值挖掘最重要的一环。传统ETL工具将无法发挥作用,因为大数据的数据来源复杂多样。 目标:实时数据质量监控与清洗,通过强大的集群和分布式计算能力提高数据质量监控性能,保证负载均衡和高可靠性。 工具:Flume,Scribe,Kafka,Time Tunnel和Hado原创 2017-01-21 16:06:12 · 729 阅读 · 1 评论 -
文章标题
分布式文件系统HDFS1.概述分布式文件系统(Distribute File system)是指文件系统管理的物理资源不一定存储在本地节点上,而是通过计算机网络与本地节点相连。Hadoop引入了虚拟文件系统机制,提供了一个文件系统抽象类(org.apache.hadoop.fs.FileSystem)。HDFS的设计目标是为了存储超大数据文件,而且提供了对数据的流式访问接口,适用于大规模数据处理。原创 2017-02-13 16:49:21 · 342 阅读 · 0 评论