目前也面试了几家公司hadoop工程师的职位,总结一下面试题,以供参考。 一、Hadoop基础: 1、 hadoop读写文件的过程? 2、 hadoop集群可以从哪几个方面优化?块的大小怎么设置?槽位怎么设置? 3、 mapreduce程序的执行过程是怎么样的? 4、 mapreduce程序中join和group by是怎么实现的? 5、 Hive语句可以从哪几个方面优化?优化后效率怎么样? 二、项目方面: 1、 做过什么项目,整体流程是怎么样的,处理什么数据,对数据怎么分析处理? 2、 hadoop集群是用在什么方面的,有多少个节点? 3、 项目的实施和维护过程中出现过什么问题,怎么解决的? 转载 :http://blog.sina.com.cn/s/blog_ac9e44210101ogz0.html