自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(187)
  • 收藏
  • 关注

原创 刚刚!MiniMax敲钟上市,市值高达827亿港元!闫俊杰爆料:内部代码80%都由AI完成,公司平均年龄29岁,账上超十亿美金

刚刚,MiniMax(0100.HK)正式登陆港交所上市,发行价为165港元(约合人民币147.9元),开盘价为235.4港元(约合人民币211.0元),较发行价上涨42.67%,目前已涨到270.8港元,总市值约为827亿港元。智谱上市之后,MiniMax打响中国大模型IPO的第二枪!刚刚,MiniMax(0100.HK)正式登陆港交所上市,发行价为165港元(约合人民币147.9元),开盘价为235.4港元(约合人民币211.0元),较发行价已涨到270.8港元,总市值约为827。

2026-01-09 16:17:09 516

原创 DeepMind发布SIMA 2!打通「感知-推理-行动-反思」闭环

Deepmind推出的SIMA 2,让智能体能在虚拟环境(商业游戏)中,边聊天边进行复杂的多模态推理。作为具身通用智能的原型,SIMA 2已从静态数据集迈向无限程序化生成的训练场。游戏领域的进步,一直是可被视为迈向通用人工智能的前奏,从棋类到多人合作的即时战略游戏,例如星际争霸。

2026-01-09 16:14:38 475

原创 Stack Overflow 为啥越来越“凉”?15 个扎心原因:它不是被打败,是被自己耗光了

最讽刺的一点在于:Stack Overflow 花了十多年积累的内容,变成了 AI 模型的燃料——而这些 AI 现在回答问题更快、更友好、更少审判感。曾经帮助无数人学习的“问答圣地”,如今处在一个开发者经常“根本不需要再去问”的时代里。当然,它并没有字面意义上的“死”。平台仍有一些角落非常活跃,高手们还在解决复杂边界问题,旧帖也仍然有参考价值。对很多人来说,Stack Overflow 更像一个参考库、历史档案、或用来二次确认 tricky case 的地方。

2026-01-09 16:12:00 359

原创 黄仁勋年终总结:DeepSeek是去年对美国AI贡献最大的一项工作!AI的算力成本每年下降超10倍;预训练从未结束;5年内会出现大量垂直AI公司

黄仁勋指出,随着市场不断扩大,每个模型公司都可以选择自己想要差异化竞争的垂直方向或细分领域,比如“最强的编程模型”或“最容易使用、最适合大众的消费级产品”,他预测大模型领域未来会呈现出高度多样化的形态。在最新采访中,老黄自信满满地放出了这句豪言。这句话背后的原因是,前段时间,《No Prior》的Sarah Guo 与 Elad Gil 邀请英伟达 CEO 黄仁勋做了一场“2025年终总结”。

2026-01-09 16:10:21 336

原创 多模态推理新范式!DiffThinker:用扩散模型「画」出推理和答案

DiffThinker 的出现,标志着生成式多模态推理(Generative Multimodal Reasoning)时代的开启。它证明了扩散模型不仅能画画,还能进行严密的逻辑推理。对于长程、视觉中心的复杂任务,将推理过程从「文本流」转变为「视觉流」,或许正是通往下一代通用人工智能的关键一步。如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。一、全套AGI大模型学习路线AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能。

2026-01-08 16:01:46 487

原创 注意力机制大变革?Bengio团队找到了一种超越Transformer的硬件对齐方案

Sliding Window Recurrences for Sequence Models》为下一代长文本模型架构指明了一个方向:真正的效率并非仅仅来自算法复杂度的降低,更来自于对底层计算硬件物理特性的深刻理解与对齐。通过将数学上的线性递归转化为硬件友好的块级矩阵运算,Phalanx 层成功在训练速度与模型质量之间找到了一个更优的平衡点。随着 2025 年之后 LLM 继续向超大规模上下文和实时具身智能演进,这种硬件感知的算子设计将成为构建更绿色、更强大 AI 系统的核心基石。

2026-01-08 16:00:16 318

原创 英伟达、英特尔和AMD芯片同台竞技:CES 2026各自都展示了怎样的实力

黄仁勋在CES 2026上带来的是基于全新计算哲学的Rubin计算平台。游戏显卡的单点硬件思维已经靠边站,极端协同设计为AI而生正当时。在这种设计理念下,整个服务器机架不再是零部件的堆叠,而是被视作一台独立的超级电脑来设计。为了实现这一目标,英伟达一口气发布了六款核心芯片,每一款都针对AI工厂的需求进行了极致优化。这六款芯片的核心是Rubin GPU。作为Blackwell架构的继任者,Rubin GPU集成了3360亿个晶体管,相比Blackwell的2080亿个晶体管有了质的飞跃。

2026-01-08 15:48:33 444

原创 刚刚!智谱唐杰发内部信:回归AGI主线,GLM5很快发布!不做传统公司,用咖啡精神做AGI!曝2026发力点:模型架构和学习范式

今天是智谱生命中激动人心的一天,是智谱历史上一个重要的里程碑,更是智谱一个全新时代的开启。我很喜欢Z.ai这个品牌,Z是字母表中的最后一个,代表终极境地,我们希望在AGI的探索历程上能走到智能的终极境地,这是我们努力的目标。1月8日,大模型六小龙第一股,智谱上市了,市值直超551亿港元,而且一路涨幅超已逾7%。

2026-01-08 15:47:30 788

原创 AI智商巅峰对决:16款超越人类智力的顶尖模型全解析

本文的撰写目的,并非对人工智能与人类之间的“智力之争”进行评判。它仅仅是为了论证一个核心观点——人类级别的推理能力,已不再是人工智能技术发展的上限。这份榜单直观展现出,大型语言模型仅用了极短的时间,便跨越了那些曾经被视为“卓越智力”专属领域的界限——至少从标准化测试的测量维度来看,这一结论成立。与此同时,这些测试分数也让我们对“智力”的定义有了全新的认知:智力绝非仅凭标准化测试分数就能被完整定义。

2026-01-07 10:28:06 555

原创 AI祛魅之后:2026年将是AI脱下华丽外衣并穿上工装的一年

2025刚刚过去,这一年像是对人工智能的一次全面体检,而2026年将是这项技术展现其实用价值的关键年份。2026年将是人工智能脱下华丽外衣并穿上工装的一年,技术从喧嚣的概念验证正式迈向产生真实价值的产业深处。2025刚刚过去,这一年像是对人工智能的一次全面体检,而2026年将是这项技术展现其实用价值的关键年份。整个行业的焦点正在发生实质性转移,不再单纯执着于构建参数规模越来越庞大的语言模型,转而投向那些更为艰巨的任务,即如何让AI真正变得好用。

2026-01-07 10:26:42 751

原创 布局和身份一把抓!浙大开源 ContextGen:双重注意力机制,实现布局与身份的协同控制

ContextGen 构建于 DiT 基础模型之上,旨在实现多实例图像生成(MIG)中布局控制和身份保持的双重控制。该框架将布局图像和多张参考图像连接成统一的上下文序列,并通过双重上下文注意力机制在 DiT 的不同层级进行分层控制,以实现对宏观布局和微观身份的解耦管理。1.双重上下文注意力机制部署在 DiT 的前置和后置层,专注于全局结构信息。CLA 负责利用上下文中的布局图像来学习布局信息,鲁棒地锚定对象到期望的空间位置,确保精确的布局控制。部署在 DiT 的中间层,专注于高频的细粒度身份信息。

2026-01-07 09:24:32 516

原创 真实音频场景,大模型集体挂科!首个原生语音基准MultiChallenge

Audio MultiChallenge的发布证明了语音绝不仅是文本的简单投射,包含着实时状态跟踪、情绪理解以及复杂的口语特质处理。Scale AI的这一记重锤敲醒了业界:如果我们不能撕掉那层精美的语音外壳,解决模型对自然语音中不完美特征的感知断层,那么AGI驱动的自由交互,将永远停留在听懂单词却不懂逻辑的初级阶段。如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。一、全套AGI大模型学习路线。

2026-01-07 09:23:16 295

原创 别被室内基准高分骗了:大模型是在推理空间,还是在「背答案」?

OSI-Bench 暴露了现有大模型在空间智能层面与实际应用需求之间的巨大鸿沟,更让我们对当前模型是否真正具备可泛化的空间能力提出了质疑。我们呼唤一种全新的空间智能范式,相较于 data-driven 的分布拟合,我们需要真正赋予模型在空间中感知、在空间中思考的工具与能力。OSI-Bench 的基准与评测代码已全部开源。未来,我们将持续开源更多带有高精度 3D 信息的开放世界视频数据,推动空间智能从室内场景走向复杂的开放世界。

2026-01-07 09:22:01 542

原创 2025年人形机器人产业盘点:技术破壁与场景爆发齐飞,全面重塑生产与生活

2025 年人形机器人的应用爆发,离不开产业底层能力的全面升级。截至年末,国内已有 100 多家人形机器人整机厂商,叠加零部件、数据服务企业,形成完整产业链。2025 年,全球人形机器人产业迎来历史性转折 —— 从实验室技术验证迈向规模化商用的关键节点,中国凭借政策、技术、资本的三重加持,成为全球产业发展的核心引擎。

2026-01-06 09:50:21 728

原创 从技术管家到AI领航者:CIO如何驾驭AI转型浪潮?

随着AI深度融入企业,CIO正经历数十年来最深刻的角色转型,正逐步成为事实上的“首席AI官”。相比单独设立CAIO,关键在于明确AI战略的领导权与治理机制。随着AI不断融入企业,CIO的角色正迅速拓展至AI领导领域,负责以负责任的方式推广AI,并创造可衡量的商业价值。CIO的角色正经历着几十年来最重大的变革。CIO一直负责企业的IT运营,包括企业使用的软件和技术服务,但随着AI在现代企业中的迅猛崛起,CIO的角色也在不断拓展。

2026-01-06 09:49:24 844

原创 AI破解500年《纽伦堡编年史》天书!仅用1小时,隐藏惊天真相被揭开

2026开年王炸!Gemini 3.0 Pro仅用1小时,暴力破解533年未解的《纽伦堡编年史》天书。从0.02美元的算力成本到精准复原16世纪学霸的历法对账单,AI正以全知视角降维打击传统考古!就在刚刚,500年前的《纽伦堡编年史》天书,被AI破解了!其中的一段手写注释,难倒了人类历史学家整整500年。这些注释字迹残损严重,夹杂着大量中世纪拉丁文缩写,几个世纪以来,学者们始终无法解释它的含义。然而,Gemini 3.0 Pro仅在一个小时内,就清晰地给出了解读!

2026-01-06 09:47:28 737

原创 DeepSeek-OCR是「长文本理解」未来方向吗?中科院新基准给出答案

如果说传统的长文本处理是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式记忆。VTCBench的出现,正是为了确保模型在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。一、全套AGI大模型学习路线AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取。

2026-01-06 09:46:14 415

原创 字节Seed:大概念模型来了,推理的何必是下一个token

DLCM(Dynamic Large Concept Models)将大模型的推理单位从token(词) 动态且自适应地推到了concept(概念)层级。LLM的下一个推理单位,何必是Token?刚刚,字节Seed团队发布最新研究——将大模型的推理单位从token(词) 动态且自适应地推到了concept(概念)层级。DLCM通过。由此,传统LLM中基于均匀、冗余Token信息密度的计算分配,被转化为面向概念的动态推理与自适应算力分配。在以推理为主的基准任务上,DLCM在将推理阶段FLOPs降低。

2026-01-05 13:54:26 677

原创 清华2024 ACL提出 DRAGIN:精准捕捉 LLM 实时需求,动态检索增强生成再破局

RIND组件实现了基于LLM实时信息需求的精准检索时机决策,避免无效检索;QFS组件突破局部上下文限制,构建更贴合真实需求的检索查询。该框架具有轻量级特性,无需对LLM进行额外训练、微调或提示工程,可直接集成到LLM中。其核心适用场景为开源LLM的本地部署(需访问模型自注意力得分)。但现在对于RAG的生成模型,更多基于闭源模型。因此,解决闭源LLM无法访问自注意力得分的限制,DRAGIN的优势能够延伸至更广泛的应用场景。

2026-01-05 13:52:57 746

原创 OpenAI首款硬件定型为笔!网友:就叫oPen吧

OpenAI花费这么多时间精力做出来的笔,真的是想让我们写字吗?OpenAI推出的第一款AI硬件,产品形态完全超出了这段时间大家的猜测。答案被指向了一支。据了解,该硬件设备由前苹果首席设计官Jony Ive共同参与设计。不仅具备音频能力,还能通过配对的智能手机或其他终端,与ChatGPT进行。消息传出后,有脑洞大开的网友直接给它起名叫oPen(我没有笑.jpg)。

2026-01-05 13:51:17 710

原创 田渊栋2025年终总结:救火Llama4但被裁,现任神秘初创公司联创

在 2025 年 1 月底被要求加入 Llama4 救火的时候,作为一直以来做强化学习的人,我事先画了一个 2x2 的回报矩阵(reward matrix),计算了一下以下四种可能(虽然在那时,因为来自上面的巨大压力,不同意是几乎不可能的):当时想的是我们去帮忙的话,即便最后项目未能成功,也至少尽力而为,问心无愧。不过遗憾的是,最后发生的是没在计算之内的第五种可能,这也让我对这社会的复杂性有了更为深刻的认识。

2026-01-05 13:49:18 745

原创 四项新年抉择助力Devops成功

在过去的两年里,随着AI Copilots、代码生成器和氛围编程的出现,开发人员和自动化工程师往往需要花费更多的时间,加深他们对于编程语言的了解,并拓展他们的技能,进而横跨不同的云端架构开展工作。专家们也建议,我们与其学习新的AI工具,不如审查在企业中已使用的平台内开发新的AI能力的机会。的高级副总裁兼流程咨询主管Alok Uniyal表示,“我们要强化在自我修复系统和平台可靠性方面的专业知识,毕竟由AI驱动的根本原因分析和自主修复,将越来越准确地决定企业如何满足苛刻的服务等级协议(SLA)的各项要求。

2026-01-05 13:47:34 688

原创 2026年值得关注的七款智能体AI浏览器

Dia浏览器是由The Browser Company开发的一款基于AI的浏览器,旨在将AI直接融入到你的日常工作流程中,让你可以与标签页互动、更快地规划、用自己的声音撰写内容,并在保持强大隐私控制的同时提高工作效率。ChatGPT Atlas是OpenAI的基于AI的网络浏览器,它将ChatGPT置于浏览体验的核心,让该助理可以跟随你浏览网页,理解你的操作,摘要页面内容,甚至直接在你所浏览的网站中为你完成任务。智能体浏览器使用自主AI智能体,可以为你浏览网站、填写表单、执行多步骤任务并与网页互动。

2026-01-05 13:46:15 550

原创 ControlNet作者张吕敏最新论文:长视频也能实现超短上下文

苏州大学校友,斯坦福大学博士,ControlNet 创作者张吕敏团队为此投入了研究,提出了一种新的解决思路,给出了专为长视频设计的记忆压缩系统,在压缩的同时尽可能保留精细视觉信息。大部分的高质量视频生成模型,都只能生成上限约15秒的视频。清晰度提高之后,生成的视频时长还会再一次缩短。这就让尝试AI视频创意的创作者们非常苦恼了。要想实现创意,必须使用分段生成,结合首尾帧,不仅操作起来很麻烦,而且需要来回抽卡来保证画面的一致性。那么,限制视频生成时长的瓶颈在哪里?

2026-01-04 10:40:53 990

原创 OpenAI的2026:要么封神,要么破产

2026 年将是 OpenAI 的生死赛点。面对预计 170 亿美元的惊人现金黑洞和谷歌 Gemini 的凶猛反扑,奥特曼被迫启动「红色代码」。一边是史无前例的千亿融资计划,一边是推理成本倒挂的财务危机,这究竟是通往 AGI 的必经之路,还是硅谷最大的泡沫破裂前夜?在硅谷的聚光灯下,奥特曼正骑着独轮车,手里抛接着越来越多的球。图片系 Nano Banana Pro 生成对于这位 OpenAI 的掌舵人来说,仅仅打造一个全知全能的聊天机器人似乎已经显得过于保守。

2026-01-04 10:39:43 411

原创 机器人也怕疼!港城突破性电子皮肤:主动痛觉 + 损伤自检双buff拉满

来自香港城市大学的研究团队提出了一种全新的神经形态机器人电子皮肤(neuromorphic RE-skin,NRE-skin)。这下,你打人形机器人,它真的会「疼」了。来自香港城市大学的研究团队提出了一种全新的。NRE-skin通过模仿人类神经系统,利用分层(Hierarchical)的神经形态架构,让触觉信号不再需要传到中央处理器,而是在皮肤内部就完成了初步处理与脉冲编码。网友表示这种复杂而精细的触觉感知,将会为机器人领域带来一次巨大的跃迁。

2026-01-04 10:37:13 737

原创 LangGraph 记忆存储的三重境界

AI助手的记忆其实是对人类记忆机制的数字化模仿。就像人类会忘记久远的细节,但记住重要的事件一样,AI记忆系统也需要在完整性和效率之间找到平衡。LangGraph提供的这套记忆存储方案,虽然还不够完美,但已经为我们指明了方向。未来,随着大模型能力的提升和存储技术的发展,AI的记忆机制肯定会变得更加智能和高效。但无论如何变化,有一点是确定的——真正的智能,离不开良好的记忆管理。如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

2026-01-04 10:35:17 657

原创 AI 编程:重构工作流的思维与实践

Vibe 本来就是“氛围”、“感觉”的意思,所以直译过来就是“氛围编程”或“沉浸式编程”。但这里的“沉浸”不仅仅是让你沉浸在一个有仪式感的编程环境里,更重要的是它颠覆了我们以往写代码的方式。我直接上核心观点:就是从「计算机语言描述工作流程」到「自然语言描述工作流程」的转变。打破编程门槛:AI 让每个人都能"编程"Vibe Coding 压根就不关心你代码具体怎么实现的,核心关注点是代码生成的结果对不对。至于实现逻辑、底层细节这些繁琐的活,都交给 AI 去搞定。

2025-12-31 10:43:47 713

原创 自回归因果注意力也能并行解码?上交联合UCSD突破LLM推理瓶颈,模型代码全开源

近期,来自 UCSD Hao AI Lab 和上海交大 Deng Lab 的团队提出了一种突破性解决方案 ——Jacobi Forcing。在大语言模型(LLM)落地应用中,推理速度始终是制约效率的核心瓶颈。传统自回归(AR)解码虽能保证生成质量,却需逐 token 串行计算,速度极为缓慢;扩散型 LLM(dLLMs)虽支持并行解码,却面临训练成本高昂、质量下降及 KV 缓存兼容问题;投机解码(Speculative Decoding)则需额外引入草稿模型,系统复杂度大增。

2025-12-31 10:41:57 689

原创 摩尔线程天使投资人:对近期AI的四十个观察

本文作者为摩尔线程天使投资人、中国初代 AI 投资人王捷。他于今年 8 月发表了《浮现中的 AI 经济》一文,对即将到来的 AI 经济进行了展望和解读。本篇文章是他近期对当前 AI 的思考的小结。

2025-12-31 10:40:33 519

原创 三维空间太难懂?RoboTracer让机器人理解复杂空间指令,推理3D空间轨迹,开放世界也能精确行动

北京航空航天大学、北京智源人工智能研究院、北京大学等机构联合推出了具备 3D 空间理解与推理能力的多模态大模型 ——RoboTracer。本文的主要作者来自北京航空航天大学、北京大学、北京智源人工智能研究院和中科院自动化研究所。本文的第一作者为北京航空航天大学博士生周恩申,主要研究方向为具身智能和多模态大模型。本文的共一作者兼项目负责人为北京智源研究院研究员迟程。本文的通讯作者为北京航空航天大学教授盛律和北京大学计算机学院研究员、助理教授仉尚航。

2025-12-31 10:39:05 1028

原创 区块链与 AI 融合:为何大家都在谈热词,却没人讨论具体的架构?

区块链与人工智能(AI)的结合绝非炒作,其本质是为了解决分布式系统在信任、验证和协调方面的核心架构难题。尽管文中所述的链下计算链上验证、不可篡改模型注册表以及联邦学习协调等模式较为复杂,但它们确实是当前环境下行之有效的实践方案。这种集成绝非简单导入一个代码库就能实现,它需要对两项技术有极深的理解,需要周密的架构设计,更需要对成本和权衡有理性的预期。然而,一旦找准了应用场景,这些模式就能解锁区块链或AI单打独斗时无法企及的能力。

2025-12-31 10:37:27 619

原创 AI智能体的五脏六腑

AI智能体的出现,标志着人工智能从工具时代向伙伴时代的转变。对于技术人员来说,理解AI智能体的原理和架构,是跟上时代步伐的必要条件。对于企业管理者来说,提前布局AI智能体应用,将是在激烈竞争中脱颖而出的关键。2025年被称为智能体爆发元年,这波浪潮已经来临。关键不是你是否准备好,而是你是否愿意主动拥抱这种变化。那些提前理解和应用AI智能体的企业和个人,将在这次技术革命中占据先发优势。而那些仍然停留在传统思维模式中的,可能很快就会被时代抛弃。

2025-12-30 13:14:14 610

原创 389万寻找翁荔继任者!OpenAI紧急开招安全防范负责人

可以说,OpenAI安全团队负责人的频繁更换和流动,也一次次加深了人们对OpenAI“不重视安全”的印象。百万年薪急招一名高管!在一连接到多起安全指控后,OpenAI终于坐不住了。于是在最近,这家公司豪掷55.5万美元(约合人民币389万元)+股权,原地开招一名安全防范负责人(Head of Preparedness)——其核心职责是,制定并执行OpenAI的安全防范框架。而且CEO奥特曼还特意强调:这将是一份压力很大的工作,你几乎会立即面临严峻的挑战。

2025-12-30 13:13:01 447

原创 突发!腾讯AI Lab副主任、首席科学家俞栋传出离职

俞栋博士拥有爱达荷大学计算机科学博士学位,印第安纳大学布卢明顿分校计算机科学硕士学位,中国科学院自动化研究所模式识别与智能控制专业硕士学位,以及浙江大学电气工程学士学位。他在语音识别和深度学习领域的开创性研究广受认可,研究方向涵盖语音处理与识别、多模态交互与智能体系统、大语言模型等自然语言处理任务,核心技术以深度学习为主。在学术层面,俞栋的影响力毋庸置疑。论文发表400+出版专著2本多次获得IEEE、NAACL、EMNLP等顶级奖项曾任ICASSP 2021技术主席他的研究,长期聚焦在。

2025-12-30 13:11:37 811

原创 被锁死的想象力:当AI成了科研本身,人类只能是观众

别盯着AI写的烂文案了!千亿级投入超越曼哈顿计划,科研速度抛弃人类带宽,一场「里氏10.0级」的震荡已在眼前。这不仅是工具的升级,更是文明断裂的开始。欢迎来到,人类即将无法认知的时代。我们对未来的想象力,可能被锁死了。现在大家纠结的,是AI写的文案有股人机味,是它能不能帮我工作让我早点下班。Steve Newman泼了一盆冷水:别盯着那些多出来的手指看了!那只是技术演化早期的「噪音」。他引用了阿马拉定律——技术的短期影响往往被高估,而长期潜力却总被低估。

2025-12-30 13:10:19 713

原创 港科大NIPS 2025新成果:R3框架让RAG检索器实现环境中自我进化

很有意思的一篇论文,R3的提出重构了RAG系统的优化逻辑——与其让庞大的LLM适配检索结果,不如让轻量的检索器主动适配LLM和任务。这一思路不仅大幅降低了RAG的落地门槛,更为后续AI系统的“模块化优化”提供了重要参考。但需注意的是,这一策略目前存在显著的适用边界:其核心依赖 LLM 的概率计算来划分正负例,而闭源 LLM 通常不对外开放概率输出接口,仅能获取最终生成结果,无法满足这一核心需求。

2025-12-30 13:07:23 895

原创 华人一作!Meta等复刻AlphaZero神话,AI甩开人类自修成神

SSR的出现,意味着我们终于找到了一条摆脱「数据饥渴」的路径。以前我们认为,要想AI写好代码,必须有无数的人类程序员贡献代码和修Bug的记录。现在SSR告诉我们:只要有代码库(Raw Code)就够了。当然,SSR还只是第一步。它目前的验证还主要依赖单元测试,还没法处理那种跨越数月的大型重构任务。但它指明了方向:超智能软件系统的诞生,可能不需要人类作为老师,只需要人类的代码作为战场。

2025-12-29 13:49:54 725

原创 奥特曼摊牌:别再比模型跑分了,苹果才是真宿敌

别被 2025 年的模型乱战骗了!这可能是一个巨大的误判。LifeArchitect在上帝视角复盘:当下的喧嚣不过是爆发前的「基建期」。AI圈最不缺的就是「尖叫声」。模型发布的频率越来越密,名字一个比一个响,参数一个比一个吓人。每隔几周,就会有人跳出来宣布:「下一代来了,世界又要变了!这种信息轰炸,带来一种错觉,仿佛AI革命的巨浪已经拍到了脑门上。但,这种直觉,可能并不准确。2025 年的所有喧嚣,像是一场蓄谋已久的「战前储备」。巨头们在等,他们在等一个足以掀翻棋盘的「奇点」。

2025-12-29 13:48:20 697

原创 陶哲轩亲自曝光:AI破解数学难题,竟全是「抄」的?

数学大神陶哲轩近期发现,AI声称破解的Erdos难题,实则是多年前已被人类解决但被遗忘的「旧闻」。最近几周,数学界就发生了几起这样让人「哭笑不得」但又几个大名鼎鼎的(数学怪才保罗·厄尔多斯提出的悬赏问题,解决它们是数学家的荣耀),被最新的人工智能工具「自主」解决了。全网本来准备欢呼AI又一次超越人类,结果反转来了。不对啊!这些问题,早在几年前、甚至十几年前的冷门文献里,就已经被人解决过了!这事儿就有意思了。AI 以为自己搞了原创新发,结果是在搞「考古」。但这事绝不仅仅是一个「AI闹乌龙」的笑话。

2025-12-29 13:46:50 694

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除