
面试
幻兽帕鲁
这个作者很懒,什么都没留下…
展开
-
大模型算法面试
我回答是按照句子的关键词去查找。如果是一个问题,例如“为什么摩擦会生电”,怎么判断这个句子里的关键词呢?前天面试了某外企公司的大模型算法岗,这次准备的很不充分,针对项目问的问题,也没有继续深挖下去。面试的问题已经忘了差不多了,现在赶紧补一下,能记一点记一点。4.如果你们用bm25检索,又用了embedding检索,最后检索出来多少条文本?我回答是按照段落去切分。2.你这里提到了bm25检索器,什么是bm25?必须有一个打分模型。这个打分模型是什么样的?这些问题还没有回答完全,等待补充。原创 2024-09-26 09:20:25 · 136 阅读 · 0 评论 -
预测算法面试
当然全域商品的mape肯定会更偏向低销商品的mape,那么有些重点品销量高,如果以mape来优化,那么重点品的指标肯定被忽视了。这里我是提到了一些有销量关联的商品,然后把两种历史销量都输入到特征里,然后合并成一个logits序列后再分别输出两种历史销量。然后还有调价模型,问我是不是用了运筹优化算法,其实运筹优化算法的比例比较小。这次面试的是一个预测算法的岗位。虽然我对供应链相关的预测很厌烦了,但是这个不是供应链领域的,感觉应该还好。最后的算法题不是很难,后面空间复杂度再优化的改进,在提示下也做出来了。原创 2024-07-10 11:49:28 · 380 阅读 · 0 评论 -
大模型面试(三)
正负样本不均匀的问题:实际场景,正样本远少于负样本,用了针对样本不平衡的loss比如dice loss,weighted ce等,然后多种loss采用加权和的方式进行融合(问题:有没有其他融合的方式呢?后来使用了HyQE的方法,针对一段文本,提出一个问题和它对应,以补充的问题来建立文档索引。主要是从网上爬取文本数据,然后给公开的审核接口先过一遍,然后训练过程中遇到的难样本,重新标注再训练。有两个困难,一个是RAG的优化,一开始RAG是比较慢的,而且召回率不高;大模型的应用主要是面向to C还是to b的?原创 2024-07-09 12:53:33 · 426 阅读 · 0 评论 -
大模型面试(二)
大模型灾难性遗忘的问题:回答说我们主要是专用领域大模型,所以对通用问题用其他大模型回答;如果是一般的解决方案,专有数据:通用数据大概在1:10的量级。大模型部署:知道量化,比如8bit量化,原来模型参数是bf16类型,可以转换成int8类型;其他微调的方法:当时脑袋短路,没想出来,事实上还有ptuning,prefix-tuning,adapter等等方案。调了lora的参数rank,还有其他参数可以调的吗?开源大模型:项目里用的是浦语大模型,此外还了解chatglm,llama,qwen等等。原创 2024-07-05 18:06:15 · 368 阅读 · 0 评论 -
需求预测算法面试
就是类似推荐算法的思想,把商品在门店的周转率组合成矩阵,然后进行矩阵分解,每个店的特征可以用一个k维的向量来表示;深度学习主要是TFT,有一个类似LSTM的短期的时序模块和一个attention的长期时序模块。对模型的优化上线之前,需要经过仿真系统测试一下,看看仿真系统上的表现怎么样,如果业务指标不好就不上线。计算两种商品的共现频率,类似于jaccard index,划分一个阈值,高于阈值的商品使用联合预测方法。深度学习的样本用了多少?2.深度学习时序模型,不用太多样本,用最近的样本,只选取最近2个月的。原创 2024-07-02 21:46:34 · 479 阅读 · 0 评论 -
大模型面试经验(一)
我回答说有一个规则判断的方法,如果问到的问题不匹配提问的规则,那么就过滤掉。但是面试官后面的反问里说,业务上是先训练一个意图判断的接口,看看这个是属于哪个分类,然后调用相应的agent。大模型在电商的应用场景主要是导购机器人,这里的问题是如果是连衣裙搭配,大模型怎么回答?疑问:如果是这样的效果,现在的推荐算法,猜你喜欢这种能不能做?项目里还写用到了强化学习,但是其实强化学习的用处不大。这一点回顾简历的时候也发现了,所以算法工程师根据场景选择合适的算法是重要的,不要为了什么高大上的技术去搞一个新算法。原创 2024-04-29 12:36:52 · 267 阅读 · 0 评论