感觉整个流程还挺快速的,4.6一面,4.8二面,4.10三面,4.11显示已完成。之后就是煎熬地等待oc,4.16oc😀
文章目录
一面(100min)
简历部分
1.自我介绍
2.为什么不投算法岗位而是投数据分析岗位
3.说一个自己觉得讲的项目或实习经历
4.项目相关的内容
5.当数据缺失时怎么处理。除了直接舍去还有什么方法。如何使用聚类方式去填补缺失值
6.kmeans聚类的实现流程(讲了,中间讲到kmeans的初始点随机选取。接下来问…)
-
kmeans的初始点如果是随机选取的话,怎么知道哪种聚类结果是好的?比如说重复了100次,哪一次聚类是最优的呢
-
kmeans中的距离是怎么定义的。kmeans计算距离的权重怎么分配
-
如果是欧氏距离,那么性别(0(表未知)、1和2)和年龄(20、30和40)的这种怎么处理
-
那么两个人一个20岁的男性一个20岁的女性,两个人一个20岁男性和一30岁男性,哪一对更加接近
7.建模时怎么选出有用的变量
SQL
1.表table 字段qq号、age,得到年龄第n大的所有qq号
2.表table,字段qqx,qqy,均为qq号,表示的是左边的关注右边的。求互相关注的qq号
3.给了表格,让写出left join操作之后的结果
Python
1.对于生成器了解吗?知道xrange吗?
2.用生成器实现斐波那契数列
3.对字典按照value值进行排序
4.深拷贝和浅拷贝的区别
机器学习
1.LR的原理
<