腾讯提前批一面复盘

信息流推荐相关,做策略算法,短视频推荐中心

  • 自我介绍(参加面试准备【面向简历】)
  • spark相关
  1. 看我简历上写了会spark,spark是基本应用工具,让我讲下spark的基本工作流程,基本架构,阐述一下(https://www.cnblogs.com/BYRans/p/5889374.html)(https://www.cnblogs.com/openAI/p/8481646.html)(https://blog.youkuaiyun.com/qq_38048590/article/details/82345590
  2. spark是基于Scala语言的,有没有阅读过spark的源码(mllib,spark sql)知道底层原理?(https://www.cnblogs.com/code2one/p/10162632.html
  3. 提交一个job后的工作流程,job提交到哪里?submit job 到哪里?spark count 显示再哪里?driver/worker的概念?(https://www.cnblogs.com/bonelee/p/6039386.html
  4. RDD的中文含义?RDD是怎么存储的?spark常用的transformer操作有哪些?spark最耗时的步骤是啥?spark中虾否运行很  长时间,reduce by key,耗时是因为有虾否(https://www.cnblogs.com/bonelee/p/6039719.html)(https://www.imooc.com/article/29068
  • python相关
  1. 引用计数的概念(https://www.jianshu.com/p/ecea193abec4)(https://blog.youkuaiyun.com/reasonyuanrobot/article/details/83793511)
  • 聊美团的实习
  • 小伙伴还喜欢
  1. 小伙伴是一个独立的页卡?
  2. 小伙伴的业务背景是?是登陆后获取好友信息,然后把推给朋友的推给我吗?
  3. EE的意思(探索,利用),主要是做探索还是利用?
  4. 头图指啥?相当于兜底数据?
  5. 头图和EE图片,EE的概念?EE是实时反馈的数据?EE图片是随机展示给用户的?
  6. 是把ctr最高的展示给用户?
  7. 用了哪些特征,指标确定策略,长宽是特征吗,落实到哪里了?给EE图片打分?
  8. 设计比例,权重计算等,都是根据统计规律吗?
  9. 最后是全量了?收益提升了2%-5%
  • 关键词抽取
  1. tfidf抽取关键词,user侧和item侧是相当于做用户画像吗?
  2. 分词是怎么做的,jieba分词?(用ansj包)
  3. 关键词做特征?出来的关键词做特征向量是高维向量?
  4. 意思是你对每个user 和每个item取top5,把这个作为user或者item用户画像的特征?
  5. 召回模型具体是什么模型?(dssm)
  6. dssm是个双塔模型,有了解吗?
  7. 还有其他的召回算法?其他的召回策略?
  8. 精排模型有哪些,有了解?实习接触到模型?精排模型看过?
  9. 精排模型是自己搭的?还是用tf?
  10. 线上auc大大提升?auc的概念是什么,具体什么内容?召回率是?精确率是?https://blog.youkuaiyun.com/u013385925/article/details/80385873https://www.cnblogs.com/Zhi-Z/p/8728168.html
  • 聊爱奇艺的实习
  1. 对用户用GMM做了分聚类(分组),用了什么特征?(用户刷新次数/停留时长/留存)
  2. 为什么用GMM而不用kmeans?
  3. GMM模型上线了吗?
  4. 构建了收入/收藏特征。那么他们这边的召回模型是用啥?(应该改成排序模型)
  • 聊比赛
  1. 打比赛用了xgboost/gbdt/rf,为什么同时用三个树模型在里面,进行模型融合,而不是只用一个xgboost 
  • 说算法题
  1. 二叉树的层序遍历(思路)
  2. 如何判断单链表是否有环(思路)
  3. 判断两个单链表是否有交点
  • 机器学习算法
  1. 说一个最熟练的机器学习算法,讲下原理就好
  2. gbdt做分类和回归用的基学习器树模型你觉得是不一样的吗?(让我回去再看看)
  • 问我有什么问的
  1. 问他们那边召回和精排用了什么模型(icf/ucf/fm/tag召回/aloy,xgboost/lr-->nn/an)
  2. 业务场景(腾讯视频app,做短视频)
  3. 组织架构(平台与内容(信息流)/短视频推荐技术中心(用户画像/召回/精排/粗排)
  4. 技术栈(spark/大数据处理/偏算法研究,用spark做数据分析,做策略算法开发)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值