2024-JAVA-大数据-面试汇总_大数据java部门面试

4,Hive数据倾斜怎么产生的? 怎么处理?
5,Spark 数据倾斜怎么产生,如何处理?
6.  大表和小表如何进行查询?
7.说说HashMap?
8.hashMap使用什么样的数据结构?如何扩容?
9.hashMap线程安全吗?和它对应的hashTable呢? CurrentHashMap呢?
10.HashTable 和CurrentHashMap 的区别?
12.用过哪些设计模式? 讲讲动态代理模式 和单例模式
13 写一下单例模式,在多线程情况下呢?
14 设计一个栈,包含出栈,入栈,是否为空等
15 求两个大数相加,每个数100位长度。

字节提前批二面

1.自我介绍
2.介绍一下Spring及Springboot.
3.Spring IOC如何解决循环依赖的问题?
4.有没有产生过依赖A依赖B,B依赖C?
5介绍一下Spring AOP
6Spring AOP用的哪些设计模式?
7 JDK代理和CGlib代理有啥区别?
8,假如没有接口,又含有final,如何使用动态代理。
9没有mybatis,如何写dao层?
10.说一下没有mybatis时,通过JDBC具体如何实现这个过程的?
11.了解java线程池吗?
12.线程池在提交任务和执行任务时是怎么做的?
13创建线程池,当里面的线程数量达到最大时,会出现什么问题?
14 说一下ThreadLock?
15 说一下mysql的事务的隔离级别
16 讲一下mysql的存储引擎
17 mysql的索引有哪些?
18 写两个代码? 
1 实现一个链表反转,设置一个步长,每隔几次,链表进行反转
2 设计一个hashMap,实现一个put方法。

阿里一面 实习 4月24日  面试时长2小时  挂

阿里的第一次面试:
1.自我介绍
2.研究的课题以及培养方向
3.介绍一下你参与的项目
4.项目中有哪一部分是有技术难点的,以及技术架构是怎么样的?
5.50个人的并发量也很低,为什么会出现系统页面数据显示过慢?
6. 那你们是怎么解决那个页面显示速度过慢?
第二个系统介绍 
7.如何将多个部门的数据进行融合?
8.往系统中导入数据的时候会遇到什么问题?
9.系统前端采用什么做的?
10.导入时,进度条是通过什么技术实现的?
11.返回前端是怎么返回的?
12.前端机制,websocket有没有了解
13.第三个系统介绍
14.系统产生日志文件,一天产生多少条?
15.怎么用mapreduce处理日志文件的?
16.从业务上说一下怎么对日志文件进行分区的,怎么保存的?
17.用mapreduce处理日志文件的任务,输入是什么,输出是什么?
18. 处理日志时,输入是一个文本,要对他进行拆分,拆分的纬度是什么纬度?
19.用hive怎么对日志文件进行多维度分析的?

关于网络相关的问题

20.四层模型是哪四层,7层模型是哪7层?
21.链路层要解决什么问题? 
22.数据链路层的网络地址用什么表示?
23.三次握手和四次挥手?
24.四次挥手,断开连接的时候,经常会出现time_wait的状态,这个状态是怎么产生的?  
25.TCP是在IP的上层还是下层?  上层
26.TCP和UDP有什么区别,以及用途
27.UDP典型的应用?
28.HTTP属于哪一层协议 ?
29.HTTP底层是基于哪一层协议的?
30.HTTP和 HTTPS的区别?
31.说说对HTTP的协议有什么了解?
32.HTTPS的安全体现在哪个方面?
33.说说HTTPS协议关于CA证书这方面的了解
34.HTTPS传输时涉及到一些加密算法,有哪些了解,以及算法的应用场景 比如RSA 
35.对称加密算法和非对称加密算法的概念
36.HTTP协议的method有几种
37.get和post的区别
38.web编程了解多少?
39.在前端提交请求时,cookie中经常有个jsessionid的cookie值,这个cookie值是用来干嘛的?
40.服务器一般保存了一个session,浏览器为什么知道我多次请求在一个session里面,为什么能找到我之前的session
41.session机制

数据结构相关的知识:

42. 说说树的遍历有深度遍历(DFS)和广度遍历,一般怎么实现 
深度遍历就是先序遍历 先序遍历采用递归,
非递归需要用到栈,利用栈的先进后出特性
广度遍历就是层次遍历,应该使用非递归,需要用到队列,先将根入队,队列不空时pop,然后入左子树,再入右子树
43.排序算法都有哪些,以及他的时间复杂度
44.说说平衡二叉树的特点

问一些java语言的问题

45. 说一下==和equals的区别?
46. 为什么要重写equals和hashcode()方法
47.静态变量和静态方法,和实例变量和实例方法有什么区别?
子类不能重写静态方法
48.为什么要用静态方法和静态类
49说下关于map以及他的实现类有哪些?
50.说一下hashmap,hashtable,currenthashmap的区别
51.经常在遍历一个map时,在删除时,经常会遇到并发错误
52.设计模式 了解哪些,比如单例模式,工厂模式,动态代理模式
53.说说对垃圾回收机制的了解
54.垃圾回收机制的算法有哪些,初生代用哪些算法,老生代用哪些算法
55.如何判断出哪些垃圾该清理,哪些不该清理?

数据库方面的知识
56.说说内连接和外连接的区别
57.数据库设计时会碰到一对多,多对多时,应该怎么设计
58. 就以用户表和角色表为例,假如用户表里面放着角色表的id作为 角色表的外键,那一个用户对应多个角色时,

这样设计会有哪些问题
机器学习方面的问题
59.监督学习和非监督学习有什么区别?
60.springboot应该要接收前端ajax请求时,应该使用什么注解
61.springboot中configuration的注解有什么用?
分布式集群有哪些了解
62.nginx有哪些了解?
63.如果一个session在一台服务器上保存,下一次session请求时,nginx反向代理把我的session请求转发到另一台服务器上,这种情况该怎么处理?
64.微服务架构和一些容器的技术有什么了解?
65.docker有什么了解?

京东实习1面   通过

1,自我介绍
2  int 占几个字节? 其他几个数值型的分别占几个?
3.集合,经常用的组数和链表的有哪些? 说说ArrayList 和LinkedList
4. 说说HashMap
5. 说说conCurrentHashmap?
6 线程用过吗? 在哪用的?
7.五条线程是怎么设计的?
8.怎么启动一个线程?
9.了解反射吗? 说说反射?
10.用过Spring吗?
11.为什么在配置文件中配置了,就可以用?
12.用过redis吗 redis都有哪些数据结构?
13.说说Hadoop?
14 说说HDFS的读操作和写操作
15 说说MapReduce
16 Hive的元数据,都有哪些?
17 用过kafka吗?
18 写一个单例模式
19 final 关键字
20 介绍一下volatile 关键字

2 京东实习二面 (主要问项目) 通过

1.自我介绍
2.介绍一下第一个大数据项目,用了哪些技术,画一下架构图
3.flume采集子系统日志,这些日志数据都包含哪些?
4.集群是怎么部署的?
5.分析使用什么进行分析的?
6.系统分析的优点和缺点都有哪些?如何改进一下?
7.实时的了解多少?

祖龙娱乐     7月24日下午5点面试   时长 73分钟  (包括答案) 通过

在电脑前苦等半小时,终于面试官上线了,一看,一下两个人,我去,心理压力好大

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值