
Hadoop
文章平均质量分 61
K.Sun
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
《Hadoop生态》——第一章 核心技术
第一章 核心技术在2002年,那时候World Wide Web相对还是比较新颖的,而且在用“谷歌”查询东西以前,Doug Cutting和Mike Cafarella想通过爬取网站,并为内容建立索引来建立一个Internet搜索引擎。为了这件事情他们启动了一个叫Nutch的工程,但是这个工程需要一个可伸缩的方法来存储内容的索引。在2002年组织存储数据的标准做法是用关系型数据库管理系统(RDBMS翻译 2017-07-06 14:32:07 · 548 阅读 · 0 评论 -
《Hadoop生态》——第二章 数据库与数据管理——Hive
Hive 许可证: Apache License, Version 2.0 活跃度: 高 目的: 数据交互 官方地址: http://hive.apache.org Hadoop集成: 完全集成首先所有对在Hadoop集群上数据的访问都是通过用Java写的MapReduce任务完成的。当所有的Hadoop用户有了一个比较稳定的Java牛人团队的时候,这个在Hadoop发展初翻译 2017-07-09 13:21:17 · 501 阅读 · 0 评论 -
《Hadoop生态》——第二章 数据库与数据管理——MongoDB
MongoDB
Spark SQL 许可证: Apache License, Version 2.0 活跃度: 高 目的: SQL访问Hadoop数据 官方地址: http://spark.apache.org/sql/ Hadoop集成: API兼容如果你需要SQL来访问数据而且Hive又表现得不是那么好,而且你也愿意用Spark环境,那么你就应该考虑下 Spark SQL。Spark中翻译 2017-07-09 14:31:10 · 401 阅读 · 0 评论