我是丁师兄,专注于智能驾驶方向大模型落地,公众号:丁师兄大模型。
大模型1v1学习,已帮助多名同学上岸国内外大厂
01为什么大模型上线需要做推理优化?
面试官心理分析
面试官问这个问题,其实主要是想看两点:
第一,你知不知道产品级大模型系统里为什么要用推理优化这个东西?
不少候选人,说自己项目里用了推理优化技术,但是其实他并不知道自己为什么要用这个东西。说白了就是为了用而用,或者看别人用他也用,从头到尾都没思考过。
没有对自己的设计问过为什么的人,一定是平时没有思考的人,面试官对这类候选人印象通常很不好。因为面试官担心你进了团队之后只会木头木脑的干呆活儿,没有自己的思考。
第二,你既然用了推理优化这个东西,你知不知道用了有什么好处,同时又有什么坏处?你当时做没做过调研,为什么要用它?
你要是没考虑过这个,那你盲目弄个 INT8 量化或者 INT4 量化进系统里,后面出了问题是不是就自己溜了给公司埋雷?
你别傻乎乎的自己拍脑袋看个人喜好就瞎用一个量化技术,甚至都从没调研过业界流行的低比特量化技术到底有哪几种?每一个量化技术的优点和缺点是什么?是量化权重还是量化激活,效率如何?是不是精度无损的?
如果一个不考虑技术选型的候选人招进了大模型团队,leader 交给他一个任务,去做一个大模型业务,他在里面用一些技术,可能都没考虑过选型,随便拿来一段现成的代码就用,最后选的技术方案并不一定合适,一样是埋雷。
回到问题,对于对于真实场景的面试题,一定不是你说得越多越好,面试时间本身有限,废话太多,面试官完全没有耐心听下去。重点是要答到点上,如果答的牛头不对马嘴,一样是 0 分。
因此对于第一个问题,面试官期望的一个优秀

最低0.47元/天 解锁文章
4503

被折叠的 条评论
为什么被折叠?



