数据分析、数据挖掘、机器学习实习面经总结

统计硕士分享了他在找实习过程中遇到的数据分析、挖掘、机器学习岗位面试经验,涉及公司包括创业生态型、二手车、电商巨头、BAT等。面试内容涵盖了文本挖掘、SQL、算法、数据清洗、决策树、K-means、PCA、SVM等多个方面。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本人统计渣硕,上半年找实习,陆陆续续面试了十几家公司的数据分析、挖掘、算法相关的岗位,在这里把能记得的公司的面试内容回顾总结一下,有些记不得了,印象深刻的尽量回忆写下来。

某创业生态型企业,文本挖掘岗位

大数据部门负责人面,(了解公司业务流程做行业生态信息整合的,目前项目是全网人才抓取建库)
基础问题,各编程语言掌握情况、为何会跨专业、对相关行业的了解;
算法leader询问了的基于文本的语义分析问题,包括特征提取和tf-idf算法语义权重计算,LDA原理、爬虫基础、数据清洗相关、课程作业设计相关细节、学期课程
业务设计人才库去重问题,考虑两个:unique字段和计算文本相似度
R的一些包(Rcurl爬虫两个问题,一个是面对验证码的解决方案,一个是基于搜索引擎的爬取问题),关于R package doc 的阅读和包的改写,基于Rserve的协同工作,实现paper算法的时长,是否有自主尝试tensorflow等开源框架等,最后还问了jieba和哈工大LTP在使用上的区别,谈一下感受


某二手车,数据分析岗位

笔试:包括SQL数据查询、考了个快速排序和插入排序、mapreduce的wc功能实现

算法(写公式、作图):kmeans的迭代方式、理想目的、何时收敛;
决策树的几种类型、特征选择、相关指标计算,过拟合的解决方式(为何、如何剪枝),决策树大方差以及预测曲面不光滑问题、重抽样相关,随机森林原理;
处理流程:标准化操作、数据库相关范式 询问在上一次实习的项目经验、原理、实现以及业务逻辑,如何设置jieba分词时的参数和解决实体分词的关系


电商巨头,60BD了,数据分析岗位

记得部分,Sql笔试,决策树(建树方案、不同类型(ID3.0、C4.5、C5.0、cart)、剪

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值