阿里面试官：大模型上线前为什么要做推理优化？985学妹的满分回答！

最新推荐文章于 2025-08-08 10:07:45 发布

原创

最新推荐文章于 2025-08-08 10:07:45 发布 · 620 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#java #人工智能 #开发语言

我是丁师兄，专注于智能驾驶方向大模型落地，公众号：丁师兄大模型。

大模型1v1学习，已帮助多名同学上岸国内外大厂

01为什么大模型上线需要做推理优化？

面试官心理分析

面试官问这个问题，其实主要是想看两点：

第一，你知不知道产品级大模型系统里为什么要用推理优化这个东西？

不少候选人，说自己项目里用了推理优化技术，但是其实他并不知道自己为什么要用这个东西。说白了就是为了用而用，或者看别人用他也用，从头到尾都没思考过。

没有对自己的设计问过为什么的人，一定是平时没有思考的人，面试官对这类候选人印象通常很不好。因为面试官担心你进了团队之后只会木头木脑的干呆活儿，没有自己的思考。

第二，你既然用了推理优化这个东西，你知不知道用了有什么好处，同时又有什么坏处？你当时做没做过调研，为什么要用它？

你要是没考虑过这个，那你盲目弄个 INT8 量化或者 INT4 量化进系统里，后面出了问题是不是就自己溜了给公司埋雷？

你别傻乎乎的自己拍脑袋看个人喜好就瞎用一个量化技术，甚至都从没调研过业界流行的低比特量化技术到底有哪几种？每一个量化技术的优点和缺点是什么？是量化权重还是量化激活，效率如何？是不是精度无损的？

如果一个不考虑技术选型的候选人招进了大模型团队，leader 交给他一个任务，去做一个大模型业务，他在里面用一些技术，可能都没考虑过选型，随便拿来一段现成的代码就用，最后选的技术方案并不一定合适，一样是埋雷。

回到问题，对于对于真实场景的面试题，一定不是你说得越多越好，面试时间本身有限，废话太多，面试官完全没有耐心听下去。重点是要答到点上，如果答的牛头不对马嘴，一样是 0 分。

因此对于第一个问题，面试官期望的一个优

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。