大模型日报 2024-12-02
大模型资讯
-
标题:DeepMind 用语言游戏让大模型学 AlphaGo 自我博弈,数据限制不存在了 -
摘要:介绍了 DeepMind 最新研究的突破,通过语言游戏实现自我博弈,使 AI 系统能在无外部数据时通过内部反馈和自我交互增强能力,详细阐述了实现目标的关键条件,为通向通用人工智能提供路线图。 -
来源:https://www.jiqizhixin.com/articles/2024-12-02-4
-
-
标题:AI 做数学学会「动脑子」!UCL 等发现 LLM「程序性知识」,推理绝不是背答案 -
摘要:探讨大型语言模型在推理任务中展现的程序性知识,指出其通过可泛化策略综合推理任务解决方案,研究表明 LLM 处理数学推理问题依赖特定文档中的程序性知识,而非仅依赖训练数据实例。 -
来源:http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652545720&idx=2&sn=8b367a7a04b26794a4136a9331089211&chksm=f0956c0ebd4bc69d1b1bf3b2fbf25e711b4e18c9795560b4f847dd2dfe7c89ca0e3999dd5291&scene=0#rd
-
-
标题:离职 OpenAI 后,翁荔博客首次上新,引众网友围观学习(中文全文) -
摘要:翁荔离职 OpenAI 后首次更新博客,主题为强化学习中的 reward hacking,指出其在现实世界中部署自主 AI 模型时是主要障碍,呼吁对缓解策略进行更多研究。 -
来源:https://www.jiqizhixin.com/articles/2024-12-02-8 大模型产品 无
-
本文由 mdnice 多平台发布