阿里巴巴电话面试2面总结_数据挖掘工程师(天猫事业部)

本文分享了一位数据挖掘工程师在阿里巴巴电话面试中的经历,着重讨论了项目相关、机器学习、算法等核心内容。面试者详细介绍了项目特点、数据来源、特征向量处理以及异常值处理策略,同时深入探讨了线性与非线性分类器的差异与应用场景,以及如何解决过拟合问题、选择L1和L2正则化的方法。此外,文章还提到了如何高效寻找第k大的数,并总结了面试中关于机器学习知识的深入提问,强调了算法在实际应用中的重要性和复杂性。

阿里巴巴电话面试2面总结_数据挖掘工程师(天猫事业部)

项目相关

  • 介绍项目
  • 项目相比别人有什么优劣
  • 项目的数据从哪里来
  • 项目的特征向量的归一化与异常处理
  • 项目的下载量
  • 目前在研究什么
  • 参加天猫大数据推荐算法成绩

机器学习

  • 线性分类器与非线性分类器的区别及优劣;
  • 特征比数据量还大时,选择什么样的分类器?
  • 对于维度很高的特征,你是选择线性还是非线性分类器?
  • 对于维度极低的特征,你是选择线性还是非线性分类器?
  • 如何解决过拟合问题?
  • L1和L2正则的区别,如何选择L1和L2正则?
  • 随机森林的学习过程;
  • 随机森林中的每一棵树是如何学习的;
  • 随机森林学习算法中CART树的基尼指数是什么?

算法

  • 如何找到第k大的数?

总结

机器学习知识中问的很细,不仅需要考虑算法本身,还需要考虑应用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值