👇我的小册 45章教程:(小白零基础用Python量化股票分析小册) ,原价299,限时特价2杯咖啡,满100人涨10元。
👇我的小册 AI工具100个实战小案例:(100个AI工具实战小案例) ,原价299,限时早鸟价29,满100人涨10元。
在 Reddit 有用户发布了一个帖子,大概意思是 DeepSeek V3.1 模型有严重 bug:模型在生成内容时会在输出中随机插入“extreme”“极”或“極” 这些字词。

有用户猜测“极”字对应的 token ID 为2577,与省略号(...)的 token ID 2576 相邻,推测该异常可能源于训练数据污染或模型在推理时误选了相邻 token 路径。


其他博主在第三方 API 上碰到了同样的问题:

在官网测试存在同样问题:


某乎上也有人讨论随机替换“极”的问题:

知乎用户 hzwer(黄哲威) 分享了他的经历,在用小模型 + 开源数据蒸馏 R1 的实验里也遇到过。
“极”被模型当成了一种“结束语”,在卡壳或重复时就会蹦出来。
原文地址:https://www.zhihu.com/question/1942934856603505597/answer/1943085955868267791


最后推荐一下我们团队写的量化小册的内容(600人+订阅),53篇内容!从Python安装,入门,数据分析,爬取股票基金的历史+实时数据,以及如何写一个简单量化策略,策略回测,如何看资金曲线统统都有介绍,非常超值!
欢迎订阅:原价299 早鸟价49,即可永久阅读,终身有效。现在的价格非常非常低,只要2杯奶茶,就可以终身订阅+课程源码,还有永久陪伴群,火速来吧!


5774

被折叠的 条评论
为什么被折叠?



