- CVTE-数据挖掘组
一面(8.20):
- 自我介绍一下,简单的说一下在校的项目和所学的课程。
- 怎么看待数据挖掘?为什么要进行数据挖掘?
- 数据挖掘过程是什么?
- 介绍自己的论文工作...
- 数据处理过程中:正态分布数据补全方式有中值和均值,各有什么异同,为什么要采用后者?
- 特征选择中,相关性分析是分析什么之间的相关性?什么原理?特征和ground truth的线性表的斜率和相关性大小有关系吗?
- 逐步回归原理,以及采用什么检验方法?T检验和F检验异同。
- Boosting和Bagging原理,比较不同。Boosting对样本根据误差重加权在整个结果上体现在哪里(损失函数最小)?RF原理及其与Bagging的不同。
- 对数据挖掘组哪些方向比较感兴趣,为什么?
- 有什么想问的?
二面(8.21):
- 做个简短的自我介绍。
- 讲讲投会议的论文内容。
- 模型选的什么分类器?有没有对比算法?为什么选择SVM?为什么不用深度网络做实验(样本量有限)?
- 推导SVM,为什么采用拉格朗日乘子法?
- SVM优缺点,为什么会对缺失值敏感?
- 有哪些核函数?分别适用于什么场景?核的选择。
- 介绍一下Word2vector,Skip-gram和CBOW分别是什么?Word2Vec中负采样(negative sampling)介绍一下。采用什么平滑方法。
- 平滑操作目的是什么?平滑方法有什么?
- 是否愿意进行一个长期实习?
- 中兴-算法岗
一面(9.14)
- 介绍下自己。
- 模式识别的模块有哪些?(监督学习,无监督学习,强化学习)
- 降维的方法有哪些?(无监督:PCA;监督:LDA)
- 聚类的算法有什么?(就说了一个k means)
- 日后想从事算法岗位还是数据挖掘岗位(因为是临时被调度)
- 回答两个C语言选择题,错了一题。
二面(9.19)
- 介绍下自己
- 用英文介绍一下自己的研究方向,然后互动聊了一些。
- 怎么看待无人驾驶。
- 很多人说阿法狗将取代人类大脑 你怎么想?
- 什么是数据挖掘,包含什么工作?
- 期望的工作地点
- 怎么看待加班,以后有孩子了怎么办
- 倾向于互联网公司还是通信公司
- 说一下自己的优缺点
三、美团
一面(凉)
- 介绍下自己
- 自己研究的东西框架是什么样子的
- 设定一个场景:微信被盗,非法给亲朋好友发送信息,怎么检测是垃圾信息?
- 目前工业上或者学术上做到什么程度
- 相比较现有的,觉得自己做的东西的新颖点和创新点是什么,精度提高多少
- 手撕:二叉树层次遍历。
- 100!有多少个0 讲思想。
- 百信银行
- 什么是人工智能?
- 什么是大数据,和数据挖掘有什么区别?
- 什么是智能计算?
- 吉利汽车
- 用英文自我介绍
- 介绍了研究生期间的项目
- 项目过程中的难点
- 华为
一面
着重垃圾邮件过滤聊
- Word2Vec存在问题,关联性太强,导致词汇成对出现。。。
- 与TF-IDF对比 工业上TF-IDF用的多
- 以用户发件人作为判别信息容易导致集体误判
- 有没有考虑再过滤出错问题
二面
- 贝叶斯表达式,推导公式,结合你的问题,贝叶斯怎么实现分类
- 熟悉哪些算法(回答SVM),SVM的原理,公式,推导,怎么实现邮件分类
- 脑子有没有一个各种算法图谱?即有什么监督算法,非监督算法等
- 了解随机深林吗?
- 了解马尔科夫模型吗?
- 做过什么数据的处理?怎么处理的?
- K-means算法了解吗?
- 矩阵的推导公式知道吗(矩阵论)
- Aibee
一面
- 讲了一下面试官感兴趣的项目情况
- 情景设置 描述难点
- 机器人在0坐标出向左右走,左走为负,右走为正,第一次走一步,第二次走两步,...,依次类推,说出要走到坐标X处最少需要发出多少次口令。
二面
- 主要项目介绍
- 两个情景设置描述
HR面
- 目前为止自己觉得比较成功的事情
- 家人朋友对自己的评价
- 总结自己优缺点
- 项目的可行性考虑哪些点:问题定性,考察现有方法能否实现,细节深入,遇到问题和别人讨论,换方法是否能完成,不行再放弃。
- 如果和同事观点不一致,怎么办?
- 平安普惠
一面
- 数学:特征值和特征向量的关系,特征向量之间的关系;
- 统计问题:ROC曲线下的面积是什么;
- 机器学习:GBDT介绍;
图像的输出特征计算:500*500,stride(步长)为1,padding为0,卷积核为3*3,计算图像一层后的特征输出;
类不平衡情况的对应方法;
SVM核函数有哪些,KTT条件怎么来的,是什么;
为什么要平滑操作,什么是拉普拉斯平滑;
什么是多重共线性问题?
用什么对文本进行分词的,了解结巴分词吗?
TF-IDF中IDF是指的什么;
LR算法的原理;
- 经卫视觉
- 介绍一下最熟悉的项目;
- 手撕代码:从列表中找出最大值和下标;找出所有最大和下标;(只遍历一遍)
- SVM的损失是什么,原理及其间隔最大化体现在哪。
- CVTE校招
一面
- 操作系统:页面置换算法有哪些,为什么要进行页面置换;进程介绍;
- 数据结构:快排算法介绍一下,什么思想(二分法);堆排序介绍一下;
- 机器学习:LR和svm比较;
SVM中硬间隔和软间隔不同;
自助采样介绍了解;
XGBoost和GBDT介绍比较;
Boost和Bagging比较;
RF特性;
方差和偏差对应过拟合和欠拟合关系以及其对应模型的特性;
防止过拟合的方法;
正则化L1和L2了解,包括其原理和对应几何图形;
二面
- 介绍下自己
- 矩阵低秩分解