本人统计渣硕,上半年找实习,陆陆续续面试了十几家公司的数据分析、挖掘、算法相关的岗位,在这里把能记得的公司的面试内容回顾总结一下,有些记不得了,印象深刻的尽量回忆写下来。
某创业生态型企业,文本挖掘岗位
大数据部门负责人面,(了解公司业务流程做行业生态信息整合的,目前项目是全网人才抓取建库)
基础问题,各编程语言掌握情况、为何会跨专业、对相关行业的了解;
算法leader询问了的基于文本的语义分析问题,包括特征提取和tf-idf算法语义权重计算,LDA原理、爬虫基础、数据清洗相关、课程作业设计相关细节、学期课程
业务设计人才库去重问题,考虑两个:unique字段和计算文本相似度
R的一些包(Rcurl爬虫两个问题,一个是面对验证码的解决方案,一个是基于搜索引擎的爬取问题),关于R package doc 的阅读和包的改写,基于Rserve的协同工作,实现paper算法的时长,是否有自主尝试tensorflow等开源框架等,最后还问了jieba和哈工大LTP在使用上的区别,谈一下感受
某二手车,数据分析岗位
笔试:包括SQL数据查询、考了个快速排序和插入排序、mapreduce的wc功能实现
算法(写公式、作图):kmeans的迭代方式、理想目的、何时收敛;
决策树的几种类型、特征选择、相关指标计算,过拟合的解决方式(为何、如何剪枝),决策树大方差以及预测曲面不光滑问题、重抽样相关,随机森林原理;
处理流程:标准化操作、数据库相关范式 询问在上一次实习的项目经验、原理、实现以及业务逻辑,如何设置jieba分词时的参数和解决实体分词的关系
电商巨头,60BD了,数据分析岗位
记得部分,Sql笔试,决策树(建树方案、不同类型(ID3.0、C4.5、C5.0、cart)、剪