历经甲辰年末再到乙巳年初,由于DeepSeek V3/R1-zero/R1等模型的“出圈”似乎又让我们这些在AI领域不断“深度求索”的AIer小伙伴们过上了一个看似不那么平静的“年”,这种“年味儿”的感觉不亚于甚至更甚于去年甲辰年横空出世的“Sora”。然而不同的是,上次是来自国外带给我们视觉领域下的“diffusion“冲击,而这次则是国内所刮起的这股东方“求索”与“开放”精神。
然而,在经历了大约十多天的事件持续发酵后,我们除了看到包含在资本、股市、安全、社区、竞争等领域所引起的全球轰动外,对于回归技术本身所带来的在算法或工程上的深邃内涵思考与沉淀并不是很多,有的话也仅仅浮于表面。
记得在北方小年前一天的午后在初读DeepSeek R1的技术报告时,一时没绷住即兴写下了一篇散文诗风格的笔记《读DeepSeek-R1胡思乱想下的有感而发》,尝试站在模型拟人化的视角去理解R1-zero或R1的本身,因为当时我想这样才能更让我去深刻的体会这一次算法与工程实践的突破所带给我长久以来对某些一直在追寻着的事情的验证,所追寻的即是:系统②·慢思考下的外在显式复杂推理现象对于智能认知的内在隐式本质内涵与统一。
关于那首散文诗,感兴趣的读者可参考之前笔记链接,并附在本文末。
我想事情要从一年前自己首次开设blog笔记说起,当时的三篇连载长文:《融合RL