各大公司大数据面试题

本文涵盖了大数据面试中常见的技术问题,包括流处理与批处理的区别、Hive与HBase的存储差异、HDFS的特性和架构、Elasticsearch的原理以及与HDFS的对比。此外,还涉及Spark的执行机制、内存模型以及遇到的问题解决方案,以及Hadoop生态系统的组件、工作流程和优化策略。同时,讨论了分布式系统的基础理论如CAP,以及HBase和MySQL的比较,ES的调优和查询机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 大数据流处理技术各个的区别和联系
  2. 大数据批处理技术各个的区别和联系
  3. Hive和HBase的存储区别
  4. HDFS介绍、读写特性
  5. Elasticsearch的介绍
  6. ES和HDFS的区别
  7. HDFS HA集群搭建过吗?是个什么架构?NN只有一个吗?SNN干嘛的?能接替NN吗?
  8. 如果让你设计一个分布式文件系统,需要考虑什么?你的设计有什么好处,有什么缺陷?
  9. spark执行机制,RDD、DAG等
  10. 搜索引擎基本原理,倒排索引
  11. spark内存模型,如何解决OOM问题?如何解决SOF问题?
  12. HDFS DataNode死了怎么办,NameNode发生了什么变化?
  13. 大数据问题,10G的文件里面的数字排序
  14. HA HDFS Zookeeper什么作用,为什么要Zookeeper?
  15. Hadoop1.x和2.x之间的区别
  16. HBase架构,为什么其随机查询很快?
  17. ES如何调优?
  18. ES查询机制?
  19. 分布式系统CAP理论,重点解释分区容错性的意义
  20. HDFS读、写数据逻辑?
  21. HDFS EditLog写入了,但是NameNode元信息没保存在内存中,数据不一致怎么办?
  22. HDFS NN作用
  23. Sqoop2的实现原理和架构?如果你用MapReduce程序实现数据迁移,Map任务怎么设计,
  24. 比如给你一张表要迁移
  25. 以wordcount为例,说明MR的执行机制
  26. HBase整体架构
  27. HBase和MySQL区别,取代的可能性,场景等
  28. Hive和HBase区别,使用场景
  29. HBase架构,ZooKeeper作用
  30. HBase Region分裂,怎么分裂的,父Region是直接删掉了吗?
  31. Spark RDD的理解
  32. Spark map和flatMap区别
  33. Spark在集群中怎么执行程序的?如果有聚合操作呢?
  34. ES查询到很多数据(100万、200万),怎么返回?
  35. 数理统计与数值分析学过吗?写一下贝叶斯公式和大数定理?拿来做什么的?
  36. hadoop有哪两大服务,hdfs有哪些数据结构(?DAG懂不懂
  37. MapReduce出现数据倾斜怎么解决。给3种方法。
  38. 怎么对10亿个数字进行排序
  39. Spark的Stage是怎么划分的,如何优化。宽窄依赖。
  40. Spark的TaskScheduler是怎么分配task的,源码看过吗
  41. Spark哪些部分可以优化
  42. Hadoop生态体系,MapReduce工作流程
  43. HDFS架构
  44. HDFS的NameNode怎么知道它手下有多少DataNode的。容错机制。副本存放策略。
  45. Yarn的架构

Yarn的Resource Manager, Node Manager,AppMaster等怎么工作的,

有任务来的时候的工作流程

  1. 出现数据倾斜怎么解决。
  2. Spark的2种运行模式,standalone和cluster模式的区别,内部工作流程。
  3. Spark生态体系.和优化
  4. 如何把多个Hadoop集群连接起来
  5. RPC协议你懂对吧?你讲讲什么是RPC协议,怎么实现的?
  6. hive、hadoop、kafka、hbase(hive问了很多基础知识;hadoop搭建方式:
  7. 单机、伪分布式、完全分布式、hadoop的三大组件

大数据面试笔试资料-56家互联网公司面试笔试题资料整理汇总: hive面试.doc 京东.jpg 笔试题1.docx 笔试题10.jpg 笔试题11.JPG 笔试题12_搜狐 笔试题13_九章云极科技有限公司 笔试题14_北京东方国信科技股份有限公司-联通事业部-笔试题 笔试题15_百分点 笔试题16_Admaster 笔试题2.docx 笔试题3.docx 笔试题4_boss直聘.docx 笔试题5_面试题4的实现思路.docx 笔试题6.jpg 面试总结 面试题1.doc 面试题2.doc 面试题3.doc 面试题7+面试题8+面试题9_北京广视通达数字网络科技有限公司 中企动力面试总结?-面试题1 畅捷通(用友集团)?-面试题2 麦达数字面试?-面试题3 boss直聘面试?-面试题5 博易智软(北京)技术股份有限公司?面试题7 公安部第一研究所?面试题7 IBM?面试题7 车网互联?面试题7 凯立德科技股份有限公司?面试题7 北京捷通华声语音技术有限公司?面试题7 北京法意科技有限公司?面试题7 树科技(重点)?面试题7 北京XXX宇有限公司??面试题8 盛世全景?面试题8 华胜天成?面试题8 联龙博通?面试题8 麦网?面试9 京东金融?面试10 滴滴打车 架构师?面试11 神州?面试11 百分点科技?面试11 锐安科技?面试12---有笔试 人人贷?国舜科技?面试13 宜信?面试16 明略数据?面试17 爱奇艺面试面试18---爱奇艺明确有背景调查,记在面试评测上面,由hr写背景调查评测----(直接卡死了) 奥维云网?面试26 喜马拉雅FM?中星电子?银橙传媒?面试27 电信云计算?面试题29 乐视?面试题29 优酷?面试题29 无双科技公司面试题30 亿玛在线公司面试题30 58同城?面试题30 talkingDate?面试题30 慕华信息科技有限公司?面试题30 美团网?面试题31 LeanCloud?面试题31 筑巢新游?面试题31 阿里巴巴?面试题32 博睿宏远?面试题33 融易通?面试题33 中国互联网络信息中心?面试题33? 优酷土豆?面试题33 乐视?面试题41 TalkingData?面试题41 网德天下?面试题41 东方国信?面试题41 畅捷通?面试题41 太极?面试题41 北京四中网校?面试题41 SenseTime?面试题41 易观智库?面试题41 银创科技?面试题41 京东?面试题41 壕鑫互连?面试题41 滴答拼车?面试题41
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

3分钟秒懂大数据

你的打赏就是对我最大的鼓励

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值