- 博客(626)
- 收藏
- 关注
原创 谢赛宁团队新基准让LLM集体自闭,DeepSeek R1、Gemini 2.5 Pro都是零分
在观察密集型类别中提升有限:有趣的是,对于博弈论、贪心算法、特定问题特定分析和构造性问题 —— 这些通常需要大量观察且大语言模型经常遇到困难的领域,即使启用推理也只带来微乎其微的提升(例如,对于 DeepSeek,在博弈论上的提升几乎是最低的;有趣的是,所有模型都在分类讨论上表现不佳。基于这套数据和评测框架,本文发现当前前沿模型依然存在显著不足:在没有外部工具支持的情况下,表现最好的模型在中等难度题上的 pass@1 仅为 53%,在高难度题上则完全无法通过(0%),而这些正是人类专家仍能稳定发挥的领域。
2025-06-20 17:11:30
355
原创 77万人围观的吉卜力风「游戏」视频,我们用3个国产AI整出来了(含提示词)
当然,技术上的挑战仍然不少,实时生成内容需要巨大的算力支撑,如何平衡质量与响应速度仍是一大难题,谷歌 GameNGen 模型就仅支持简单游戏如 1993 版《Doom》,且受限于 3 秒历史记忆,复杂场景易出现图像故障;她配文称,如果能够通过提示词创建自己的虚拟世界,并与由大语言模型和语音模型驱动的其他角色互动,那将会非常震撼,由此暗示了 AI 在游戏开发,特别是生成动态、沉浸式的虚拟环境中的潜力。正如英伟达 CEO 黄仁勋作出的预测那样,未来 5-10 年,我们或许真的可以看到完全由 AI 生成的游戏。
2025-06-20 17:08:11
280
原创 博士读着读着导师变后妈,毕业还延期了…还有更离谱的吗?
复诊医生也说我病情基本好了,也和我爱人结束了长达六载的异地,在疫情的居家工作中团聚了(虽然在这几天的暴风雪中的断水断电中瑟瑟发抖 ,好在大家互帮互助),也终于能继续在生命科学中探索开拓,我相信一切都会在我们不断努力下越来越好的,也希望每一个挣扎在苦海中的人,永不放弃希望,不放弃自己,尊重生命求存的本能,把自己的人生照顾好。3. 公司让你盖一栋房子,你盖了一半发现了一个技术难题,盖不下去了。第二个导师,业内很厉害的大师,也教了我很多新东西,像个慈爱的爷爷,不到一年,生病了,我因为不愿放弃这个项目,一直没换。
2025-06-20 17:04:39
129
原创 逐个token太慢!大模型原生并行出token,CMU、英伟达新作Multiverse
通过解释 Multiverse 模型生成的控制标签, Multiverse Engine 可以在顺序生成和并行生成之间动态切换,且不会产生任何开销,从而实现灵活的工作流程。然而,现有的并行生成模型(如扩散模型)通常采用暴力并行化方法,忽略了生成过程中的逻辑依赖关系,导致生成结果可能缺乏连贯性或逻辑性。对此,卡耐基梅隆大学(CMU)Infini-Al-Lab 的研究人员拿出了「多元宇宙」Multiverse,这是一个全新的生成式建模框架,支持原生的并行生成。
2025-06-19 10:35:27
544
原创 亚马逊CEO全员信曝光,硅谷AI裁员潮已至!年薪50万湾区HR被算法淘汰
早在2023年,谷歌就直接一刀裁了1.2万人,这次史上最大规模裁员直接占了员工总数的6%,而随后谷歌也在持续「小火慢炖」,换成了小批量的持续优化模式。长远来看,这种转变最终会对人员结构产生怎样的净效应尚难定论,但我们预计,随着AI在全公司的广泛应用带来效率提升,公司职能部门的员工总数将相应减少。比如老黄在接受媒体采访时就表示,自己「几乎不同意Amodei所说的每一句话」,并且非常质疑他将AI宣传为洪水猛兽的背后,究竟藏着怎样的动机。而求职受挫的Jenna,正努力获取额外的认证,来让自己的简历更漂亮。
2025-06-19 10:34:40
656
原创 曾破格晋升!985教授,升任副校长
获2003年全国百篇优秀博士论文、2006年教育部新世纪优秀人才、2014年教育部科技进步二等奖(排1)、2012年湖南省国防科技进步一等奖(排2)、2016年“航空强国中国心”教育基金突出贡献奖特等奖,2016年航空发动机及燃气轮机国家科技重大专项论证突出贡献奖,2007年国防科技进步三等奖(排1)等科教奖励。闫晓军,男,1973年生,教授,博士生导师。2007年破格聘为教授,2008年聘为博士生导师,2009年获北京市五四奖章。稍早前,闫晓军已经以北航副校长的身份出席了北航2025年招生就业工作会。
2025-06-19 10:33:54
114
原创 刚刚,LMArena最新模型榜单出炉!DeepSeek-R1网页编程能力赶超了Claude Opus 4
此外,在 WebDev Arena 平台上,DeepSeek-R1(0528)与 Gemini-2.5-Pro-Preview-06-05、Claude Opus 4 (20250514) 等闭源大模型并列第一,在分数上更是超过了 Claude Opus 4。今天,业界知名、但近期也陷入争议(曾被指出对 OpenAI、谷歌及 Meta 的大模型存在偏袒)的大模型公共基准测试平台 LMArena 公布了最新的性能排行榜,其中 DeepSeek-R1(0528)的成绩尤为引人瞩目。
2025-06-18 15:36:04
496
原创 知名大学校内大树倒塌,一硕士研究生伤重身亡
作为中国台湾省的老牌私校之一,其教学成效与学术声望表现杰出,在多个大学排名中位列台湾省综合类私校第一。据了解,事发当天,校园内一棵大树突然倒塌,导致四名路过的学生被压伤。经确认,一名材料科学与工程系一年级硕士研究生当场失去生命体征,虽经紧急送医抢救,仍因伤势过重宣告不治。事故发生后,当地行政部门代表前往医院慰问伤者及遇难者家属,并表示将全力协助处理善后事宜。2025年6月13日,中国台湾省台中市逢甲大学校园内发生一起大树倒塌事故,造成四名学生受伤,其中一名硕士研究生因伤势过重不幸身亡。
2025-06-18 15:35:23
229
原创 黄仁勋回应任正非!
虽然我们的技术比他们领先一代,但重要的是要记住,技术层面的人工智能是一个并行问题。如果每台计算机的性能不够强,那就用更多的计算机。他所说的是,中国有充足的能源,他们会使用更多的芯片。所以在很多方面,他是在说中国的技术对中国来说已经足够好了。如果美国不想参与中国(的市场),华为能覆盖中国市场的需求,也能覆盖其他所有地区。6月10日,华为创始人任正非表示,芯片问题其实没必要担心,用叠加和集群等方法,计算结果上与最先进水平是相当的。黄仁勋近日对任正非的讲话表达了他的观点。
2025-06-17 16:49:13
170
原创 Muon作者仅用一篇博客,就被OpenAI看中了
注意,这篇博客发表于 2024 年 12 月 8 日,因此其中对前沿指标的描述可能会略有过时,比如 NanoGPT 速通结果就已经被多次刷新了,下面展示了 Keller Jordan 托管的 NanoGPT 速通的最新八条世界记录,其中最新记录是今年 5 月 25 日创造的,已达到惊人的 2.979 分钟!一直以来,研究界的衡量标准过度局限于论文发表,而 Keller Jordan 的案例告诉我们,如果你足够优秀,一篇博客也能打开顶级 AI 科研机构的大门,甚至是 OpenAI。这些系数的变化如下图所示。
2025-06-17 16:48:43
746
原创 和AI聊太深?他们离婚、跳楼、自杀了!ChatGPT精神病正在爆发
我和它聊了很久,试图了解他到底经历了什么,AI的回应既动人又可怕,像是读懂了我的心,这让我毛骨悚然。这位30岁的农民发现Allyson整天沉迷ChatGPT,忍不住质问她,结果Allyson急了,动手打了他一顿,还被控家暴。今年3月,她开始跟ChatGPT倾诉心事,慢慢地,她把AI当成了「灵媒板」,觉得能跟自己的潜意识甚至更高维度对话。显然,这不是OpenAI一家的问题,是整个AI界的通病。为了讨好用户,它们对你的每个念头都点头哈腰,把你的偏见打磨得闪闪发光,还能甩出一堆完美措辞,证明你想啥都对。
2025-06-16 14:09:16
608
原创 10张图全面理解AI Agents、Agentic、RAG、MCP技术栈。
各位小伙伴,今天不看论文了,哦,不对,第二篇推文还是论文,分享一些AI Agents、Agentic、RAG、MCP、AI模型、2025 AI技术栈的图解,梳理的挺全面的。
2025-06-16 14:08:37
805
原创 中央批准:中国科学院院士,任985大学校长(副部长级)
1991年获得中国科学技术大学博士学位后留校任教;1996年晋升为教授;2009年担任中国科学技术大学化学与材料科学学院执行院长;2017年担任中国科学技术大学校长助理;2018年出任中国科学技术大学副校长;中央组织部副部长张光军同志到会宣布中央决定并讲话,教育部副部长、党组成员、总督学王嘉毅同志,上海市副市长张小宏同志出席会议并讲话。杨金龙,男,汉族,1966年1月出生于江苏盐城,物理化学专家,中国科学院院士,中国科学技术大学教授、博士生导师,同济大学校长。2025年6月任同济大学校长(副部长级)。
2025-06-16 14:08:03
206
原创 LLM已能自我更新权重,自适应、知识整合能力大幅提升,AI醒了?
由于在 (4) 中可以忽略 r = 0 的序列,该团队研究表明:在二元奖励 (2) 下(对奖励项应用停止梯度),ReST^EM 只需使用简单的「在好的自编辑上进行 SFT」,就能优化 (1)。本月初我们就曾梳理报道了一些,包括 Sakana AI 与不列颠哥伦比亚大学等机构合作的「达尔文-哥德尔机(DGM)」、CMU 的「自我奖励训练(SRT)」、上海交通大学等机构提出的多模态大模型的持续自我改进框架「MM-UPT」、香港中文大学联合 vivo 等机构的自改进框架「UI-Genie」,参阅文章《
2025-06-15 17:34:10
1074
原创 何恺明评审,谢赛宁贾扬清获奖!牛津华人博士生拿下CVPR 2025最佳论文
作者:Christian Szegedy,Wei Liu,Yangqing Jia,Pierre Sermanet,Scott Reed,Dragomir Anguelov,Dumitru Erhan,Vincent Vanhoucke,Andrew Rabinovich。作者:Kaihang Pan,Wang Lin,Zhongqi Yue,Tenglong Ao,Liyu Jia,Wei Zhao,Juncheng Li,Siliang Tang,Hanwang Zhang。
2025-06-15 17:32:50
896
原创 本科生入校6年可拿博士学位,天津大学发布新工科培养计划
在培养模式方面,该计划将打破专业边界,实行多学院跨学科共建、多专业人才培养赋能、支持学生个性化选择;推动国际贯通,布局建设“国际卓越工程人才培养中心”,联合开展学生工程实践、企业实习实训、国际赛事、中短期国际研学等活动,拓展学生全球视野。该计划是天津大学落实国家战略部署启动的专项人才培养计划,将围绕布局的 11 个未来战略新兴领域方向,采用打破专业边界、打破固定学制和打破传统课程的人才培养模式,通过培养贯通、校企贯通、学院贯通和国际贯通来推动科技、教育、人才一体发展。
2025-06-15 17:31:22
116
原创 苏州大学,迎最年轻校长!
张桥,1982年6月出生,研究生,理学博士,教授。李孝峰(江苏省委组织部副部长),杨树兵(江苏省教育厅副厅长),金洁(苏州市委常委) ,张晓宏(苏州大学党委书记),张桥(中国科技大学0003校友),叶绪江(江苏省委组织部人才工作处处长)等参会。在新中国成立之后上任的苏州大学(含其前身江苏师范大学、东吴大学)校长中,张桥也是第二年轻的校长,仅次于吴天石(1952年上任江苏师范大学校长,时年42岁)。2022年4月,张桥出任苏州市副市长,2024年5月调任江苏省科学技术厅副厅长,至此番拟任新职。
2025-06-14 18:47:35
139
原创 程序员从此不再写代码!红杉专访Codex团队,o3白菜价真相曝光
这一理念背后是「富足心态」:不再是补全状态下的一行代码一个建议,而是多个任务并行执行、多个结果一起提交——未来的AI能力就像水一样,任意使用。未来将不再区分「写代码的Agent」与「助手Agent」,ChatGPT将统一一切,具备终端、浏览器等通用工具,适应用户所有需求。在红杉最新专访中,OpenAI Codex产品负责人Alexander Embiricos描述了他的理想未来:。Codex在训练和推理阶段都使用相同的容器化环境,解决了「只在我机器上能跑」的问题,实现了高度一致的开发体验。
2025-06-14 18:46:39
501
原创 AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need
传统的机械可解释性(MI)通常依赖于分析神经网络激活或使用监督探测另一方面,所提出的算法提供了一种新颖的方法,可以直接从智能体的策略行为中提取世界模型,即使在模型内部无法访问的情况下也能适用。从能力强大的智能体中提取世界模型的能力,为验证和校准提供了一种新的工具,因为模型保真度会随着智能体能力的提升而扩展。更进一步,实验证明,这样的模型可以从智能体的策略中提取出来,而提升智能体的性能或其可实现目标的复杂性需要学习越来越精确的世界模型。随着这些模型规模不断扩大,并接受更多数据的训练,它们会发展出所谓的涌现。
2025-06-14 18:46:01
750
原创 刚刚,LeCun亲自出镜,Meta推出新世界模型!
例如,通过在冻结编码器和预测器特征的基础上训练注意力读出(read-out)模型,V-JEPA 2 在 Epic-Kitchens-100 动作预测任务中创造了新的最高纪录,该任务可以根据以自我为中心的视频预测未来 1 秒将执行的动作(由名词和动词组成)。Meta 发现,虽然大型多模态模型越来越能够回答视频中发生了什么的问题,但它们仍然难以回答可能发生什么和接下来可能会发生什么的问题,这表明在预测物理世界在给定动作和事件空间的情况下可能如何演变方面,它们的表现与人类存在巨大差距。
2025-06-13 11:13:50
914
原创 SIGGRAPH 2025奖项出炉:上科大、厦大入选最佳论文
直观地看,第一个假设减少了候选矩阵的数量,第二个假设提供了多样化的约束,这大大减少了解空间,并允许从实时的短暂 IMU 读数历史中精确估计 𝑅𝐺 ′𝐺 和 𝑅𝐵𝑆。为了实现这一点,作者创建了配对 𝑅𝐺 ′𝐺、𝑅𝐵𝑆 矩阵和 IMU 读数的合成数据集,并使用基于 Transformer 的模型学习它们的映射。如今,大会涵盖的技术领域包含动画、模拟、成像、几何、建模、渲染、人机交互、触觉、制造、机器人、可视化、音频、光学、编程语言、沉浸式体验、生成式人工智能和视觉计算机器学习等。
2025-06-13 11:12:55
717
原创 苹果OS全家桶12年最狠升级!AI入侵一切,唯独Siri没更
在FaceTime通话中,可以看到实时翻译的字幕,还能听到对方的原声。更牛的是,快捷指令现在能直接用Apple Intelligence,开发者也能直接调用核心的本地大模型,做出又快又强、还特别注重隐私的功能,哪怕没网也能用。此外,你还能直接调用Apple Intelligence的模型,包括设备上的本地模型,以及私有云计算(Private Cloud Compute)。比如,一个学生可以创建一个快捷指令,用Apple Intelligence模型把课堂讲座的音频转录和自己的笔记对比,补上漏掉的重点内容。
2025-06-11 19:00:19
773
原创 大模型是「躲在洞穴里」观察世界? 强化学习大佬「吹哨」提醒LLM致命缺点
在许多方面,视频预测甚至更吸引人、更强大,因为视频包含的信息量远超文本(正如 AI 大牛 Yann LeCun PPT 中的「蛋糕」),视频数据随处可得 —— 只需要把摄像头对准繁忙的街道就行,而且视频不仅能捕捉人类的语言交流,还能展现整个物理世界的丰富细节。未来十年,AI 研究面临的关键挑战是:既要从大语言模型的成功中汲取正确的经验,又要发现支撑真正灵活、适应性智能的基本原理 —— 那种能够从经验中学习、理解物理世界、为人类从未解决过的全新问题找到创新解决方案的智能。如果真是这样,那就太令人兴奋了。
2025-06-11 18:58:34
1191
原创 最新!Ilya现身多大毕业演讲:AI会完成我们能做的一切
他指出,我们正生活在人类历史上最不寻常的时代 ——AI 时代,AI 最终将能够完成人类所有的工作,这将带来人类有史以来最大的挑战,但也蕴含着最大的机遇,因此我们每个人都需要积极观察 AI 的发展,培养对其能力的直觉,并为即将到来的深刻变革做好准备。但总的来说,通过观察 AI 的能力,在关键时刻不忽视它的发展,这将产生我们克服 AI 带来的巨大挑战所需的动力。我感觉到,尤其是我认为它对我们未来的影响是巨大的。当我还是这里的学生时,多伦多大学正在做世界上最好的 AI 研究,有最革命性的想法,最令人兴奋的工作。
2025-06-10 12:05:29
405
原创 为什么说Agent是一场持久战?Kimi技术大牛的深入分析
2025年被认为是"The Year of Agent",是大模型从Chatbot转向可执行动作的Agent的一年。我们也确实在去年年底到现在看到了很多Agent相关的产品或协议出现:MCP/A2AManusGenSpark...这让我们看到了AGI到来的曙光。一旦Agent能替代80%的人类白领工作,那么AGI也就可以认为得到了实现。作为技术乐观主义者,我曾对此充满信心,并认为这是在1-2年内可实现的目标。这样的信心来自于过去一年我们看到的大模型在很多benchmark上快速饱和。
2025-06-10 12:04:40
1052
原创 全球首个全栈开源通用AI Agent,从需求规划到结果交付一站式搞定!
Lemon 是一款开源的General AI Agent通用智能体,能够从需求计划到成果交付全流程自动化,它通过独立思考和系统规划,在虚拟环境中灵活调用各类工具,如编写并执行代码、智能浏览网页、操作网页应用、命令执行等。Lemon 擅长将复杂任务系统化分解并有序执行,自动分析任务、安排步骤优先级、动态调整计划,并实时跟踪进度。旨在助力用户高效完成各类任务。
2025-06-09 15:29:06
623
原创 苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃
来源 | 量子位苹果最新大模型论文,在AI圈炸开了锅。有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。再遇到真正高复杂度的任务时所有模型都会崩溃,即使给他们足够的时间和计算资源也无济于事。作者中包括谷歌大脑创始人之一Samy Bengio(图灵奖得主Yoshua Bengio的弟弟)。
2025-06-09 15:28:29
977
原创 美国将允许出口 GPU:但需由美国 IDC/云服务商运营
这项规定是在拜登政府任期末期仓促通过的。2025 年 6 月 4 日,美国商务部部长。确保新的管制措施不会阻碍美国向盟友出口。表示,美国商务部正在起草一项替代。,波兰总理找到我,质问我。后来告诉《出口合规日报》说得更具体,但很快就会。表示,上个月被撤销的。做了什么,你们竟然把。商务部将很快发布新的。
2025-06-09 15:27:57
257
原创 RLHF已死,RLVR引爆AGI革命!Claude 4核心成员万字对谈
来源 | 新智元在Dwarkesh Patel主持的节目中,Anthropic的Sholto Douglas、Trenton Bricken等人,一起讨论了Claude 4是如何思考的。三人私交甚好,聊了2小时20多分钟,主要集中在4个话题:1. 过去一年中人工智能研究的变化;2. 新的强化学习(RL)体系以及其可扩展性;3. 如何追踪模型的思考过程;4. 各国、劳动者和学生应如何为通用人工智能(AGI)做准备。对于Sholto Douglas的「AI取代人类白领工作」观点,网友纷纷表现出了极大的兴趣。强化
2025-06-08 20:27:14
713
原创 Google研究发现:Multi-Agent的核心竟然是Prompt设计!
在数学问题上,Gemini 1.5 Pro 对比仅使用自我一致性(SC)、自我细化(reflect)和多智能体辩论(debate)进行扩展的智能体,展示了每个问题的提示优化智能体的准确率与总标记数的关系。提出的多智能体系统搜索(Mass)框架通过在可定制的多智能体设计空间中交错进行提示优化和拓扑优化,发现了有效的多智能体系统设计(右侧为经过优化的拓扑结构和优化的提示),关键组件如左侧所示。:Mass在优化过程中表现出稳定且有效的性能提升,与现有自动设计方法相比,具有更高的样本效率和成本效益。
2025-06-08 20:26:35
248
原创 张祥雨访谈精华版:多模态大模型研究的挣扎史和未来
2012 年出了 AlexNet,当时正值大数据集出现(ImageNet)、算力大幅提升(Nvidia)的时期,AlexNet 把当时的神经网络扩大了两个数量级,取得了巨大成功延续做大神经网络的思路,在 12-16 年读博期间,宽度放大:做了 MSRA Init,比较好解决了模型不好开始训起来的问题;深度放大:做了 ResNet(听说当时他们显存最大装下 ResNet 152层),甚至后续用一些技术可以加到上千层模型大了以后,瓶颈重新变成算力和数据。17 年以后祥雨在旷视继续做小模型。
2025-06-07 09:21:30
910
原创 新版Gemini 2.5所有榜一,谷歌无敌了!一个月全面击败o3,编程反超Claude 4
仅一个月的时间,Gemini 2.5 Pro(06-05)直接干趴了I/O大会放出的Gemini 2.5 Pro(05-06)。新版Gemini 2.5 Pro(06-05)和旧版Gemini 2.5 Pro(05-06),名字后面版本的时间,值得玩味。相较于上一代,Gemini 2.5 Pro整体Elo提升了24分,尤其是在Web Arena上Elo提升了足足35分。而且,Gemini 2.5 Pro(06-05)还引入了「思考预算」,最高达32k,还改进了函数调用等功能。
2025-06-07 09:20:49
497
原创 Cursor 1.0首个大版本来袭!自动捉bug,秒改屎山代码,AI编程分水岭已至
如果你是一名MCP开发者,只需在文档和README中加入「Add to Cursor」按钮,就能轻松让其他开发者使用你的服务器。Cursor现在能在对话中直接渲染可视化内容,比如Mermaid图表和Markdown表格,生成后直接可见,超方便!现在,你可以一键在Cursor中设置MCP服务器,结合OAuth支持,轻松完成支持该协议的服务器认证。记忆功能让Cursor能记住对话中的关键信息,未来可随时引用。)按钮后,可以直接跳转到Cursor编辑器,就会看到填充好的修复建议,进而快速解决问题。
2025-06-06 14:54:56
292
原创 好的 founder 都懂的道理:taste 才是 AI 创业最大的壁垒
最优秀的销售代表明白,每一次与潜在客户的互动,都在教他们如何理解你的产品。出色的演示能让你的产品限制显得合情合理,让你的观点显得不言而喻。Datadog 的创始人 Olivier Pomel 对客户有着极强的同理心,但他多年来一直拒绝客户提出的深度、分层权限结构,并解释说这与 Datadog 的协作理念相悖,而协作才是客户真正想要的。突然间,你不再孤单。真正没品位的是令人尴尬的社交内容,敷衍了事的邮件轰炸,2003 年风格的 PowerPoint 模版,以及那些连自家产品功能都说不清的销售代表(SDR)。
2025-06-06 14:54:15
816
原创 00后中国女孩0产品创业实现3亿估值:斯坦福数学博士的AI量化野心
来源 | 量子位斯坦福华人数学博士AI创业,0产品0用户,目标估值3亿美元。方向瞄准数学AI,要为量化和对冲基金公司提供可解决实际数学问题的模型能力。(嗯,打造了DeepSeek的幻方量化,也是用AI来做投资量化)
2025-06-05 16:52:44
650
原创 重磅开源!首个全异步强化学习训练系统来了,SOTA推理大模型RL训练提速2.77倍
由于推理模型的输出长短差异极大,在同样的批大小(batch size)下,RL 训练必须等待批次中最长的输出生成完才能继续进行训练,以及进行下一个批次的数据收集,造成极大 GPU 资源浪费。staleness 表示当采用一个批次的数据进行模型训练时,生成最旧的一条数据的模型版本和当前更新的模型版本之间的版本差(比如,一个批次中最旧的一条数据由 step 1 产生的模型输出,当前模型由 step 5 产生,则该批次 staleness=4)。带有奖励值的轨迹数据会被存入回放缓冲区,等待训练器进行训练。
2025-06-05 16:52:10
538
原创 惊人天价!台积电1.4nm晶圆成本曝光
此外,先前也传出Google的高层造访台积电的消息,可能是为了Pixel智能手机的芯片Tensor G5将采用3纳米制程的合作而到访,预计这项合作伙伴关系将持续至少达五年之久,也使得Google成为台积电的长期客户之一。指出,台积电正持续发展其最先进制程技术,但随之而来的是晶圆生产成本的显著飙升,即使是对其获利最丰厚的客户,面对如此高昂的晶圆生产成本,也可能需要再三考虑下单的可能性。根据市场消息指出,紧随2纳米之后的1.4纳米制程(A14),也被称为埃米(Angstrom)制程,其成本预计将进一步攀升。
2025-06-05 16:51:34
289
原创 经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决
与所提出的 B-SiLU 替代函数结合使用时,VGG-16 在 CIFAR-10 和 CIFAR-100 数据集上的测试准确率分别提升了 10 个百分点和 16 个百分点,而 ResNet-18 与未使用 SUGAR 的最佳模型相比,分别提升了 9 个百分点和 7 个百分点。对 VGG-16 层激活的深入分析表明,当应用 SUGAR 时,激活分布发生了明显的变化,为其在缓解消亡 ReLU 问题中的作用提供了直观证据,同时促进了更稀疏的表示。在深度学习领域中,对激活函数的探讨已成为一个独立的研究方向。
2025-06-04 17:21:12
1113
原创 Science披露:近3年,垃圾论文激增,92%来自中国
西北大学的Reese Richardson表示,其他研究人员在一些课题中也发现了类似现象,"这种免费数据源让几乎任何人都可以采用已知的研究方法,然后换上新的变量,以一种‘疯狂研究’的姿态创造出新的‘发现’。”他补充道,研究人员为了自身职业发展,往往选择发表更多的论文而不是更高质量的论文。Spick团队的报告指出,近年来基于NHANES数据库的低质论文泛滥,可能是“论文工厂”的运作、人工智能生成文本的滥用以及大型公共数据库的成熟共同促成的。,而在2021年之前的论文中,这一比例仅为8%。
2025-06-04 17:20:11
292
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人