Hadoop参考资料

<!--StartFragment -->
腾讯TDW:大型Hadoop集群应用
http://www.aboutyun.com/thread-11898-1-1.html
1.腾讯为什么建设单个大规模集群?
2.腾讯建设单个大规模集群是如何优化的?
3.腾讯是如何优化JobTracker的?


搭建hadoop集群必参考的文章:为Hadoop集群选择合适的硬件配置
http://www.aboutyun.com/thread-11892-1-1.html
1.哪些情况会遇到io受限制?
2.哪些情况会遇到cpu受限制?
3.如何选择机器配置类型?
4.为数据节点/任务追踪器提供的推荐哪些规格?

问答:
请教如何将前一个mapreduce的输出作为后一个mapreduce的输入
http://www.aboutyun.com/thread-11894-1-1.html



每日一读汇总
http://www.aboutyun.com/thread-11749-1-1.html

更多:
http://user.qzone.qq.com/278595437/blog/1426006424 
### 关于Hadoop的相关文献与资料 #### Hadoop官方文档 最权威的参考资料莫过于来自Apache官方网站上的[Hadoop官方文档][^1]。这里不仅提供了详细的安装指南,还涵盖了各个组件的工作原理和技术细节。 #### 经典书籍推荐 - **《Hadoop: The Definitive Guide》** 这本书由O'Reilly出版,作者是Tom White。书中深入浅出地介绍了Hadoop生态系统中的核心概念以及实际应用案例。 - **《Programming Pig》** 对于想要深入了解Pig Latin语言及其在大数据处理方面优势的朋友来说,《Programming Pig》是一本不可多得的好书。虽然重点在于Pig,但对于理解整个Hadoop平台也有很大帮助。 #### 在线教程和课程 - **Coursera上开设的大规模数据科学专项课程** 该系列课程包含了多个关于Hadoop及相关技术栈(如Spark)的教学视频及实践项目,适合希望系统化学习的同学参与[^2]。 - **Udemy平台上有关MapReduce编程模式的入门级课程** 通过具体实例讲解如何利用MapReduce模型解决复杂的数据分析问题,非常适合初学者快速掌握基本技能。 #### 技术博客文章 网络上有许多优秀的个人或团队分享的技术心得可以作为补充阅读材料: - 探讨HDFS内部机制的文章有助于加深对其架构特点的理解; - 针对YARN资源管理和调度策略的研究报告能够提供更深层次的知识扩展。 ```python # Python代码仅用于示意,并非直接关联上述内容 print("以上列举了一些获取Hadoop相关知识的方式") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值