【面经系列】八位硕博大佬的百度之旅


前言:若需获取本文全部的手书版原稿资料,扫码关注公众号,回复: 百度面经 即可获取。

原创不易,转载请告知并注明出处!扫码关注公众号【AI机器学习与知识图谱】,定期发布知识图谱,自然语言处理、机器学习等知识,添加微信号【17865190919】进讨论群,加好友时备注来自优快云。


本文分享八位硕博大佬的百度之旅,本八位和字节篇的八位有重合但不完全相同,在分享面经前先来聊一聊备战秋招需要做的准备工作。


1、简历: 不言而喻,一份漂亮的简历非常重要。那如何制作,这里提三点意见:

1)在经验不足时多看一些优秀的简历,按照别人简历临摹叙述自己的经历;

2)在简历制作好后,找有经验的人提意见,帮忙修改,反复打磨;

3)学会对自己项目进行包装,但特别忌讳过度包装,一定对写在简历上每一点都烂熟。


2、时间: 对秋招的印象有的还停留在金九银十。但2020年秋招提前批从6月中旬就已经开始了,然后各大公司的秋招面试都集中在七八月,九月虽然还有正式批,但很多hc都已被提前批占用,加上暑期实习转正占用的hc,正式批剩下的已经不多了。所以一定要提前准备。而对于想通过暑期实习转正的同学,秋招从3,4月份的暑期实习面试就已经拉开序幕了。


3、消息: 在秋招期间一定要保持消息畅通,注意关注各大公司的官网或官方公众号,及时接收和秋招相关的信息。不要因为错过信息而错过重要的面试机会。


4、前辈: 秋招时有个靠谱内推人真的是事半功倍,在秋招时比较忌讳的就是简历投出去之后完全被动的等待,这样每一面之后都可能是漫长的等待,所以如果有内推人就可以提速面试流程,而且可以通过内推人打听相关消息,让秋招时的焦虑少一些。


5、同伴: 秋招还算是一个持久战,从面试->接受意向书->谈薪->签三方整个过程将近半年,比如今年六月中旬就开始面试,这都快12月份了还没有结束。所以队友或者说战友就非常重要,和自己的同学朋友在秋招中互帮互助,分享重要讯息和心情起伏,让秋招不只是孤军奋战,也就不会那么艰难了。


接下来还是分享一下算法岗面试流程, 以及每个环节的注意事项。面试中大致分为自我介绍,项目介绍,算法基础,代码考察,开放性考题和提问等六个环节,下面介绍这几块的注意事项。


自我介绍在面试开始时基本都会有,因此肯定是要提前准备好的,自我介绍内容不要太长,就是把你觉得是亮点的地方简单的提出来,当然凡事由你主导在面试中介绍的环节,都可以尝试在介绍中有意的引导面试官接下来的面试朝着你熟悉的领域提问,还是非常奏效的。因为大多数面试官在对你进行面试前可能刚从自己的手头的工作脱离出来,对你以及你的简历都不是很了解,因此你在介绍中的引导就会很好的起到作用。


项目介绍,介绍2-3个你认为重要的;主要要点:出发点,问题难点,contribution, 输入输出,模型重点, 自己工作占比,最终的结果。一定要提前算好内容,要有逻辑条理,分点介绍。因为紧张,说不出来,或者拼命说很多细节导致超时,都是不可取的。项目也是面试时重中之重的一个环节,和coding二兄弟基本霸占所有面试时间然后二分。因此首先要对写在简历上的项目十分熟悉,每个细节都得清清楚楚。面试多了你会发现面试官总会发现你项目中之前你没考虑到的点,所以对项目多角度思考总是好的。

算法基础这块就是指机器学习基础算法和深度学习算法,当然你所研究方向当前最火的模型也是经常会被提问到的。NLP领域不得不提的,面试必问到的当属Bert这个模型了,因此对这种大家常提到的自己也必须清楚。而机器学习和深度学习基础就要考平时的积累,当然这块也可以临时抱佛脚的哦,因为面试官常问的问题其实比较集中,多看看面经多背一背。当然这样肯定是经不住大佬细问的,问的深了就蒙圈了。所以平日有空还是多学习学习,基础知识不能丢。


代码考察,这块不用多说了,非常非常非常重要,推荐剑指offer,Leetcode和牛客上热门考题,刷题吧少年。


开放性问题这里可分为两块吧,一类就是智力题,这一类面试前确实不太好准备,大多需要面试时临场发挥,但也不用慌张,首先很少面试时还是很少会碰到,碰到的话就冷静思考把自己的想法说出来,展示自己一本正经(天马行空)的思考,只要别说一句我不会就OK。还有另一类就类似上面4中那样,问你对公司的看法,建议就是在不违和的情况下请尽情跪舔,哈哈哈当然还是看你自己啦。比如我没有舔然后就跪了,虽然不知道是不是和这个有关。但试想一下,你对他公司的认可肯定也是他选择你的理由之一啊。


提问环节时可以利用这个机会了解一下自己所面试的团队做什么,是否和自己匹配等等。只要不犯傻去问工资,感觉都问题不大。



一、博士大佬W

1、自我介绍

2、项目介绍

​ 1)介绍了一个做的推荐比赛的项目,以及模型的优化过程稿

3、算法基础

​ 1)手写auc的计算,延伸问了一些比如很大的数据量如何计算auc

​ 2)问了一下机器学习的基础,和深度学习基础,印象中是lgb,xgb,ctb

​ 3)问了几个linux和C++的问题

4、代码考察

​ 1)二维数组中的查找

​ 2)快速排序

​ 3)两个链表的第一个公共节点

5、开放性问题

6、提问环节


二、硕士大佬A

1、自我介绍

2、项目介绍

​ 1)问做过的research,实验效果,现在做的topic别人主要是怎么做的呢,具体的细节?

​ 2)正在做的idea,能不能应用到别的领域呢?

​ 3)问做过的项目,具体的流程和细节?

3、 算法基础

​ 1)ROC曲线是什么,ROC曲线的坐标轴什么含义,曲线和面积有什么物理含义

​ 2)Dropout的原理,什么时候用,怎么用,dropout训练和预测的时候有什么区别,预训练和finetune的时候有什么区别

4、 代码考察

​ 1)最长子数组和

​ 2)循环数组的最长子数组和

​ 3)编辑距离

​ 4)在一棵搜索二叉树里,找到比目标值大的最小值(限时14分钟)

5、开放性问题

​ 1)你做过的最成功的事情

​ 2)你做过的最失败的事情

​ 3)你的优点和缺点

6、提问环节

​ 1)业务和技术栈,绩效怎么分配

​ 2)一共有几轮面试


三、硕士大佬B(凤巢三轮技术面)

**1、自我介绍
**

2、项目介绍

​ 1)Bert的word piece对于中文词表的一个好处,词表变小也可防止OOV

​ 2)Bert中用的LN,LN和BN有什么区别,为什么Bert用LN

​ 3)在模型训练的时候有什么技巧和经验,比如loss不收敛等情况

3、算法基础

​ 1)优化器在模型训练时使用经验

4、代码考察

​ 1)实现前缀树的插入,查找以及某一个前缀的所有词查找

​ 2)一个人从家往公司走,只有一条路径,有东西南北四个方向,现在求这个人往东南走的最远的距离

5、开放性问题

​ 1)广告系统设计,图对广告的点击率是印象很大的,因此如果从知识图谱的角度考虑这个问题

​ 2)医美相关query搜索到相关结果,如果从搜索的结果中抽出有用的信息

​ 3)其他offer及秋招进展等相关问题

6、提问环节

​ 1)面试部门业务方向


四、硕士大佬C

**1、自我介绍
**

2、项目介绍

​ 1)介绍项目,并探讨了模型方案是否可以优化

3、算法基础

​ 1)L1和L2正则

​ 2)BN和LN的区别和用法

​ 3)神经网络防止过拟合的方法

​ 4)Dropout用法

​ 5)xgboost和gbdt

​ 5)transformer?比rnn优越在哪?

​ 6)LSTM中的各个门的计算公式和作用

​ 7)python装饰器用法

4、代码考察

​ 1)无序数组第k大的数

​ 2)实现迪杰斯特拉算法

5、开放性问题

6、提问环节


五、硕士大佬D

**1、自我介绍
**

2、项目介绍

​ 1)详细探讨了项目,如何解决数据不均衡问题

3、算法基础

​ 1)怎么进行单词划分与 Embedding;

​ 2)Attention 是什么,怎么做的?知道有哪几种 Attention;

​ 3)Transformer、LSTM 和单纯的前馈神经网络比,有哪些提升;

​ 4)为了解决长依赖,有哪些模型,是怎么做的?LSTM 和 GRU 细节;

​ 5)决策树是如何分裂节点的,分裂的增益怎么算的;

4、代码考察

​ 1)Python 两个无序数组去重合成一个升序数组

​ 2) 判断一个点是否在多边形内

5、开放性问题

​ 1)怎么判断文本低质量?

​ 2)怎么判断文本涉及黄恐暴?

6、提问环节


六、硕士大佬E

1、自我介绍

2、项目介绍

​ 1)介绍项目中用到的模型

3、算法基础

​ 1)介绍激活函数,激活函数的区别

​ 2)反卷积是怎么做的, unpooling中maxPooling怎么实现

​ 3) BERT 的变种?聊了下 ALBERT,知道模型蒸馏吗?谈了下原理

4、代码考察

​ 1)旋转排序数组

​ 2)二叉树的前中后序遍历,让递归非递归实现

​ 3)az和AZ代表0到51,如何将52进制转化为10进制

5、开放性问题

​ 1)最近看的论文有哪些,介绍一篇印象最深的

​ 2)一个系统,当一个id登陆和退出的时候的时间都是记录的,如何统计当天每个时段的人数

6、提问环节


七、硕士大佬F

1、自我介绍

2、项目介绍

​ 1)介绍项目中遇到的最大的困难,是怎么解决的

3、算法基础

​ 1)python 深浅拷贝,可变与不可变类型、原因,垃圾回收技术

​ 2)Word2vec 怎么采样负样本,有哪些方法?

​ 3)度量学习了解吗?Triplet loss 知道吗?

​ 4)Python 中变量的作用域有哪些?

4、代码考察

​ 1)给定一个字符串,找出第一个重复字符,时间/空间复杂度,如何优化

​ 2)两个栈实现一个队列,如何优化

​ 3)给定n个数,找出pair的个数,满足 x&y >= x^y

5、开放性问题

​ 1)实习中的难点

​ 2)最近经历过最有压力的事情

​ 3)目前offer,对职位的期望

6、提问环节


八、硕士大佬G

**1、自我介绍
**

2、项目介绍

​ 1)介绍实习项目

3、算法基础

​ 1)GBDT中使用了残差,为什么此时用负梯度可以拟合残差

​ 2)Word2vec讲一下,你比较熟悉哪个模型

​ 3)Skip-gram的负采样详细说说,负采样是怎么采的

​ 4)CNN与RNN有什么区别,RNN和LSTM区别

​ 5)两个正则化的参数分布,介绍先验分布与后验分布

​ 6)生成模型与判别模型区别

​ 7)大规模LR参数稀疏解怎么求

4、代码考察

​ 1)两个节点的最近公共父节点

​ 2)寻找两个正序数组的中位数

​ 3)LRU缓存机制

5、开放性问题

​ 1)搜索广告系统怎么设计

6、提问环节

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值