QbitAl-优快云博客

转载训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

每家具身公司都有自己的采集技巧，所以如果没有注入任何技巧，即便拿到很好的UMI设备，采集的数据很像人的行为，但其实是废数据，基本上模型训练不了。当时我们就有一个愿景，希望能打破这个数据获取的这个不可能的三角，把非常高质量的数据砍到白菜价，加速应用来推进这个整个具身智能行业的发展。大多数情况下，要么训不出来，要么即使是在相似的条件下能跑出来demo，时间也非常短，可能就3、4秒，也很卡顿，不丝滑。大家会有误解，总觉得UMI数据就是人拿个夹爪，就把这个视频数据记录下来就行了，非常非常简单，所有人都可以做。

2026-01-08 20:08:04 4

转载清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

先挑了一批具有代表性的反思性词汇，比如「wait」「mistake」「however」等，由几位人工专家筛选、合并成一份最终词表，然后统计这些词在训练过程中出现的频率。听起来挺温情，但从LeCun离职风波的一系列「鸡飞狗跳」来看，小扎的「煲汤式招聘」，在为Meta带来成绩之前，好像先让内部文化出现了缝隙。不过，DeepSeek-R1虽然大幅提升了推理能力，但毕竟是开源模型，如果安全性工作做的不到位，很容易被微调后用于生成危险内容。冷启动数据怎么来的，两轮RL各自干了什么，奖励模型怎么设，全都写得明明白白。

2026-01-08 20:08:04 4

原创开源“裸考”真实世界，国产具身智能基座模型拿下全球第二！

或者模型又能否真的能被社区用起来，经得起复现、质疑和改造，在真实世界的任务中不断暴露问题，最终通过生态的反向推动，从而完成自我迭代与进化。在该任务中，WALL-OSS以41分的成绩领先pi0。因此，在面对未知环境或从未见过的任务组合时，WALL-OSS不再依赖预设流程，而是能够自主拆解问题、逐步思考，并在执行过程中动态调整策略，从而具备了承担长程、复杂具身任务的能力。在这样的背景下，一个可以在消费级显卡上完成训练、推理和部署的开源具身模型，在行业中的意义就不仅是共享成果，而是弥补了行业空白，实质性地。

2026-01-08 19:00:57 364

转载智元首发SOP系统：打破离线训练瓶颈，让具身智能在“干中学”

在提升性能的同时保留泛化能力：传统的单机在线训练往往会使模型退化为只擅长单一任务的“专家”，SOP通过空间上的并行而非时间上的串行，在提升任务性能的同时保留VLA的通用能力，避免退化为单任务专家。当机器人被置于不同的环境时，即便是同样的任务，起初成功率和吞吐量如预期般下降，但在SOP介入仅仅几个小时后，机器人的性能便显著回升，能够鲁棒地执行相对复杂的实际任务。2025年机器人领域最火的VLA让机器人通过预训练具备了相当的通用性，但与此同时，机器人能否长时间，稳定，高效地完成任务仍是一个问号。

2026-01-08 19:00:57 5

转载 AI精准编辑门槛大降：开源框架提升编辑一致性，即插即用

结果就是：现有方法下，你想把“橙色猫”改写成“黑色猫”，AI可能还是给你一只橙色猫。该方法通过对注意力机制和初始噪声潜在分布的“精准手术”，实现了超高精度的图像与视频编辑，且完全无需训练、即插即用。在AI视觉编辑领域，如何在修改目标属性的同时，精准保留背景和非编辑属性的一致性，一直是个“鱼和熊掌”的难题。反演后的初始噪声中残留了太强的源图像分布信息，使得模型倾向于“重建”原图，而不是“编辑”新图。现有方法通过全局注入了过多的源图像注意力特征，导致模型更听源图像的话，而忽略了用户的编辑指令。

2026-01-08 19:00:57 5

转载刚刚，智谱港交所敲钟！市值528亿港元

本次IPO引入11家基石投资者，涵盖北京核心国资、泰康人寿等头部险资、广发基金等公募，以及JSC International等国际机构，合计认购29.8亿港元，占发售股份近七成。智谱这面「全球大模型第一股」的旗帜，或许正标志着中国大模型，从 “技术跟跑” 正式迈向 “全球竞技” 的新阶段。全球范围内通用大模型企业第一次以这样的方式走向公开市场，非常有幸智谱作为中国大模型代表，站在这个历史性的起点。智谱的Z是字母表中的最后一个，代表终极境地，我们希望在AGI的探索历程上能走到智能的终极境地。

2026-01-08 09:37:45 5

转载黄仁勋CES回应全场！内存卡了GPU脖子，游戏玩家可能只能用旧显卡了

他同时提出了“新型存储内存平台”的概念，还将英伟达定位为“全球最大记忆体买家之一”，认为其是横跨HBM、GDDR与LPDDR的关键需求引擎，指出随着AI工作负载规模急速扩大，对内存的需求早已不只是容量的竞争，而是系统层级的。预计，我们未来将具备生成几乎任何风格图像的能力，从写实风格，到极致写实风格，就是能以每秒500帧的速度，呈现出与你实时互动的照片级画质，再到你所喜爱的卡通渲染风格。他将英伟达比作AI产业的“船长”，引领着全球的供应链和合作伙伴，这份责任非常重大，他会一直做到“值得做”的那一天为止。

2026-01-07 17:11:16 16

转载给AI打个分，结果搞出17亿估值独角兽？？？

除此之外，平台还采用了人机协同的评估模式，用人类的真实投票来反映大家对模型的偏好，再通过算法去平衡各个模型的出场次数、任务类型和样本分布，避免有的模型因为曝光多就被高估，或者因为曝光少就被低估，确保整个评估过程公平客观。在评分上，平台基于Bradley–Terry模型设计了Elo评分机制，每个模型都有初始分数，赢了就加分，输了就扣分，随着对战次数越来越多，分数会慢慢稳定下来，最终形成实时更新的排行榜。这时候大家不用管模型是谁，只需要根据回答的好坏投票选出更优的那个，系统在投完票之后才会揭晓模型的真实身份。

2026-01-07 17:11:16 8

原创让欧美老外彻底“真香”，这家中国割草机器人品牌正在定义一个行业新标准

问题，小小机器人得知道现在具体的位置才能开始工作，而在真实的庭院环境中，定位要想稳定成立，首先得把活动范围划清楚——明确哪些地方能去、哪些地方不能去，避免机器人跑偏或越界，也就是要做定位部署工作。但叠起来也不是就高枕无忧，RTK能定位但吃亏在对信号要求高，Vision看得懂环境但怕光线和环境变化，雷达能感知环境和物体，但在啥都没有的空旷地，也会有点犯懵。我们来想象这样一个庭院场景：一侧是自家的草坪，另一侧可能紧挨着邻居的房子，中间有道路、篱笆、灌木，后面再接一块更大的草坪，看起来很规整，但细节其实非常多。

2026-01-07 15:11:03 454

原创首家央企AI独角兽浮出水面！背靠自研大模型，4家国家队资本背书

这是对其成绩的认可。在此背景下，国家队身份的中电信AI公司，先是靠自研模型从既有技术霸权结构中破局而出，如今又通过增资进一步加码，联手四家跨资源国家队资本，全方位协同产业链，加速推动AI赋能千行百业。比起简单的融资，中电信AI公司这次，更像是借助「增资」，把分散在各个产业腹地的「江湖高手」攒到了一块，携手为国家队的道场坐镇，合力攻克单一企业无法解决的行业技术和产业的壁垒。说到底，国家队所追求的，不是短期的项目利润，而是通过技术赋能带动产业发展，通过产业发展培育出繁荣的AI生态，最终实现多方共赢的长期价值。

2026-01-07 14:09:20 504

转载马斯克xAI又融了200亿美元！老黄说到做到投了更多

众所周知，Colossus I从无到有建成所有配套设施仅用了122天，至今仍是全球规模最大、运行状态最稳定的单一算力集群，配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72。而且这还没完，马斯克后面还搞了一个“巨硬计划”，去年底还为其专门买了代号“MACROHARDRR”的专属厂房，当时马斯克就扬言其供电规模将达到2GW。Anyway，无论是用户规模，还是算力储备、模型实力，这些都构成了吸引投资者目光的重要因素。这里还插播一则小故事。

2026-01-07 13:15:05 11

转载 8块钱跑通一次强化学习全流程，潞晨云重塑微调赛道：1名算法工程师=1支Infra团队

一旦底层资源可用，毫秒级启动，队列等待期间0计费，仅对实际prefill+sample+train的Token量收费，无资源闲置，将用户每一分钱都用在产生梯度的刀刃上。用户不再被底层繁杂的基建拖累，不再背负多职能的枷锁，也不再是黑盒填参的被动执行者，而是能够独立驾驭大规模训练流的主动设计师。强化学习涉及到更为复杂的系统设计，训练过程中存在一系列的问题，如多个模型的优化，数据的传递，以及模型权重的传递。之间落在最佳平衡点，将研究精力和算力成本从集群运维还原至算法本身，带给开发者“本地写码、云端计算”的。

2026-01-07 13:15:05 11

转载港科大教授实测AI眼镜“作弊”：30分钟碾压95%的学生，把传统教学评估体系整破防了

分数当然是有意义的，但它所能解释的范围正在变窄，理解是否真正发生、思路是否连贯、判断是否经过取舍，这些关键环节，仍然被压缩成一个单一结果，难以被区分和看见。会直接决定AI的视力，一旦题目出现模糊、反光或拍摄角度偏差，再强的模型也只能在不完整信息上做推理，最终体现在答题表现上的，就是明显下滑的稳定性。从小学一路考到大学，我们最熟悉的考试，其实一直在反复确认同一件事，那就是有没有把老师讲的内容记住，以及能不能按标准方法，把题一步步算对。

2026-01-06 15:05:44 20

原创陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

比如将MiroThinker-v1.5-30B和1T参数的Kimi-K2-Thinking对比，不仅在BrowseComp-ZH测试中实现了4.5%的性能超越，在推理成本上，MiroThinker 1.5的单条调用成本更是低至$0.07，只有Kimi的1/20。传统大模型表面上看似是预测，实则只是在知识库里搜索结果并复述出来，或者是使用未来时间范畴的数据超前“剧透”，时序敏感训练沙盒则为模型戴上一个“紧箍咒”，严格约束只能使用当前可见的信息，并做出真实预测。它不靠全知，而靠会研究、会查证、会修正。

2026-01-06 13:48:30 286

原创英特尔CES奇袭老黄大本营！英伟达显卡刚涨价，最强酷睿量产出货

千呼万唤始出来，英特尔迄今最强AI PC处理器，正式开卖了——第三代英特尔® 酷睿™ Ultra处理器，首款基于Intel 18A制程节点打造。没错，就是那个被英特尔中国区董事长王稚聪比作重庆、被视为英特尔重回制程霸主地位的关键一役的18A。在现场，英特尔客户端计算事业部高级副总裁兼总经理Jim Johnson介绍说：这次的发布，意味着英特尔不仅兑现了制程节点的计划，更是直接把半导体制造带入了一个全新的维度。这款处理器除了提升了能效、增强CPU的性能之外，另一大看点就是集成了自家的Arc GPU。为什么这么

2026-01-06 12:20:00 742

转载 OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex

尽管我要离开OpenAl去尝试探索一些在OpenAl难以开展的研究领域，但这是一家特殊的公司，也是世界上一个特殊的存在，它已然在人类历史的长河中占据了永恒的位置。截至今日，Jerry在各种公开演讲和访谈中，多次强调对“推理”而不仅仅是“模式匹配式生成”的重视，倾向把大模型看作可以通过训练“学会思考过程”的系统，而不仅是一个黑盒文本预测器。我参与了GPT-4和ChatGPT的开发工作，最近还组建了一个团队，建立了一个新的缩放训练和推理计算范式——现在，它通常被称之为推理模型。我非常享受在这里工作的日子。

2026-01-06 12:20:00 18

转载悲报！Stack Overflow彻底凉了，比18年前上线首月问题数量还少

当时的问答机制非常高效，比如提问或者答案可以被投票，投票出来的高质量内容能够自然浮到顶部，贡献者会获得Reputation（声望值），这样一来，本质上是把技术影响力量化了。，不只是程序员专属，几乎覆盖了所有STEM领域，从编程到数学、物理、统计学，只要是技术相关的疑问，在Stack Overflow上都能找到同行探讨。从数据来看，Stack Overflow的问答数量一路下滑，直到如今跌破18年前的起点，在这其中，AI真得背锅。当初的程序员问答圣地，现在的提问数量甚至比18年前上线首月时的问题数量还要少。

2026-01-05 17:38:45 1121 4

转载 1人1假期，肝完10年编程量！马斯克锐评：奇点来了

比如谷歌首个Transformer推理，以及为核心服务提供的首批大规模TPU训练和推理交付模型，包括搜索中早期的大规模神经网络模型如RankBrain和DeepRank。如果我有编程Agent，尤其是Claude的Opus，我能把我前6年的工作压缩到几个月内。：可并行运行多个Agent，但每个Agent都在自己独立的代码库分支中工作，以避免冲突。在谷歌期间，他领导了Gemini模型的工作，对Gemini预训练做出了巨大贡献。整体来说，Claude在AI编程、编程Agent方面一如既往，担任着扛把子角色。

2026-01-05 15:04:14 34

转载华为开源7B多模态模型，视觉定位和OCR能力出色，你的昇腾端侧“新甜点”来了

这款兼具轻量化、高性能与强通用性的多模态模型，既为端侧开发和个人使用提供了新选择，也将进一步丰富昇腾生态的应用场景，为创新注入新动力。整齐的三个token进行位置回归，不仅降低了模型学习难度，更显著提升了格式遵从性，让定位任务的精度和效率同步提升。这一设计让模型在训练中既能吃透长回复数据，也不忽视短回复信息，避免 “顾此失彼”，消融实验已充分验证其有效性。同时，采用多标签对比学习框架，让模型具备更优的细粒度理解能力，为后续VLM训练中的视觉定位数据学习筑牢基础。

2026-01-05 12:58:08 22

转载融资35亿后，Kimi神秘模型现身竞技场

发现这个新模型的推特网友询问了模型的身份，结果模型自报家门，表示自己来自月之暗面Kimi，训练数据截止到2025年1月。营收规模实现数量级增长，产品和商业化上聚焦Agent，不以绝对用户数量为目标，而是追求智能上限，创造更大的生产力价值。让K3成为更 “不同” 的模型，垂直整合训练技术和产品taste，让用户体验到全新的、其他模型不具备的能力。这样一来，博主和帖子下面留言的网友们纷纷推测，Kiwi-do很有可能就是AMA中提到的K2-VL。

2026-01-05 12:58:08 25

转载宇树IPO搁浅传闻满天飞，王兴兴：别当真，也不用和外人解释

近日，某媒体发布宇树科技上市相关报道（下称“该报道”），并被众多媒体、网络平台及自媒体大规模转载。据截图显示：王兴兴称：“好几周之前的，被人乱编的消息，又扩大了，大家别当真。相关报道表示：宇树科技A股上市的绿色通道被叫停，但仍可通过常规上市流程排队上市。从目前公开披露的信息来看，宇树科技的上市准备工作，整体仍沿着既定的合规流程推进。这一澄清，针对的是当日早些时候围绕宇树A股上市进程流传的相关报道。

2026-01-05 11:22:33 19

转载字节Seed：大概念模型来了，推理的何必是下一个token

另一方面，此前基于潜在推理的框架，如大型概念模型（Large Concept Model, LCM）等，不仅需要单独训练编码器和解码器，还依赖人为划分的固定的、句子级别的粒度，缺乏拓展性与自适应性。由此，DLCM通过以上四个步骤，成功地将计算分配从低效的Token-Token交互，转移到高效的Token-概念-Token 交互，实现了计算资源的自适应、结构化利用。然而，在当前的LLM中，所有token被统一处理，信息密度不均匀的自然语言消耗了同样的计算量，造成了大量的冗余与模型容量的错配。

2026-01-04 19:00:00 27

转载 MIT新论文：2026推理模型过时了，“套娃模型”当立

这种机制实际上是在外部环境中构建了一个动态的、可编程的工作记忆空间，使得模型能够像操作数据库一样操作自然语言文本，在不改变底层神经网络权重的前提下，具备了处理极高复杂度长文本的逻辑推理能力。这种递归结构不仅实现了任务的并行化分解，更重要的是它支持多层级的深度推理，每一层递归都只需要处理当前层级的局部信息，从而确保整个处理过程始终维持在模型原本的上下文窗口限制之内。RLM允许模型在编写的代码中调用一个特殊的接口函数，该函数的作用是启动模型自身的一个新实例（或更小的子模型）来处理特定的子任务。

2026-01-04 17:06:18 43

转载 OpenAI首款硬件定型为笔！网友：就叫oPen吧

他认为今天的智能手机和电脑，本质上还是开/关的二元模式，你得主动点亮屏幕、打开App、敲指令、等反馈，整个过程充满了干扰：消息弹窗、切换窗口、注意力被不断打断，甚至还会带来一点隐形焦虑。从这个角度看，Altman早早拉Jony Ive入局，更像是一次非常清醒的判断：当OpenAI开始认真考虑做硬件，那就必须得让《专业的人干专业的事儿》。长期以来，OpenAI的产品都高度依赖Apple、谷歌、微软这些平台的硬件和生态，如果真想让AI成为用户日常里的第一交互层，只靠软件显然不够。

2026-01-04 15:24:57 23

转载 LeCun曝Meta作弊刷榜，田渊栋：我没想到这个结局

LeCun预计将在12个月内，见证该项技术的初始版本诞生，并在最近几年内实现大规模进展，虽然它显然还远远称不上超级智能，但至少在通往AGI的道路上，它存在希望。因为上头的压力，全组被迫放下手头正在做的工作，来Llama 4接烂摊子，距离发布ddl就剩2个月，还要处理所有dirty work。这一特征涌现现象，从记忆到泛化的突变过程入手，试图解释模型究竟学到了什么、和输入数据的关系、能达到怎样的泛化，也就是打开模型的黑箱。LeCun他们想要做些新东西，但小扎更想要已经被验证过的、可以直接落地的技术。

2026-01-04 13:18:48 18

转载这里还有8个“Manus”：1亿美元ARR，都是ToC

成立于2022年，虽然并未对外披露1亿美元ARR的具体时间点，但在今年9月宣布启动1亿美元的员工股权回购计划时，正式宣布ARR已超过2亿美元，并预计年底前达到3亿美元。Lovable则是在2023年正式成立，并在今年7月正式宣布ARR破1亿，随后又在11月更新了这一数据，来到了2亿美元ARR，成为增长最快的AI编程工具之一。Meta有平台，有更强的触达能力还有更高效的流量组织。从Meta的视角出发，我自己在消费级AI产品上没有一个拿得出手的爆款，现在有一个经历过市场验证的Manus摆在我面前，价钱还不贵。

2026-01-03 18:00:00 26

转载百度AI芯片公司冲刺IPO：出货量国产第二

基于这一架构，百度于2018年正式启动了昆仑芯项目——从FPGA转向AI芯片研发，并在当年的百度AI开发者大会上，拿出了首款基于XPU架构的云端AI芯片“昆仑1”。公开资料显示，欧阳剑本科毕业于北京航空航天大学，随后在中国科学技术大学获得硕士学位，长期深耕计算架构与高性能芯片方向，是一名典型的“工程师出身”的技术型负责人。同时，百度作为控股股东，可以将财务资源更集中于核心互联网业务，而让昆仑芯在资本市场上自主“造血”发展，实现母子公司双方的资源优化配置。一是价值层面，便于市场为其单独定价。

2026-01-03 14:13:24 50

转载机器人也怕疼！港城突破性电子皮肤：主动痛觉 + 损伤自检双buff拉满

总体看来，NRE-skin 不仅是一种更高效的电子皮肤，更是一种具备自主感知、实时判断和自我保护机制的仿生智能系统，为未来制造更安全、更具人性化的仿人机器人奠定了坚实的工程基础。相比于以往的电子皮肤，NRE-skin没有继续沿用传统电子皮肤的“模拟信号采集”思路，而是模拟人类，直接把触觉转译成神经元式的脉冲信号。一旦压力超过阈值，系统会绕过中央处理器，直接触发类似脊髓反射弧的机制，实现毫秒级的即时保护动作（如缩回），大幅提升机器人的安全响应能力。电路层：对应人类的信号传导神经，NRE-skin的核心。

2026-01-03 14:13:24 36

转载中国“人造太阳”突破密度极限，聚变点火迎来新路径 | Science子刊

在传统的实验观测中，一旦等离子体的线平均密度试图超过这一计算出的临界值，装置内的等离子体约束性能便会急剧恶化，进而引发剧烈的磁流体不稳定性，最终导致等离子体大破裂（Disruption）。随着靶板温度的降低，物理溅射被有效抑制，反馈系数维持在低位，密度上限将不再受制于格林沃尔德定标律，而是可以随着外部控制参数的提升而大幅增加，呈现出一种近乎“自由”的高密度运行潜能。如果无法厘清这一极限背后的物理本质，建立基于第一性原理的模型来替代简单的经验拟合，便无法确信未来的聚变堆能否在设计的高密度区间内安全稳定运行。

2026-01-03 12:44:21 24

转载马斯克宣布：量产脑机接口，手术全自动化

但这层保护层也阻碍了医疗器械的植入。但对马斯克而言，Neuralink的版图中还有一片和医疗一样，广袤、神秘，且至今无人探索过的新大陆——赛博格。他认为，在ASI必然出现的那一天，人类只有拥有与硅基智能相当的高带宽接口，才不至于沦为「被圈养的宠物」。马斯克表示，到2026年，Neuralink的植入手术将升级为一种「高度简化、几乎完全自动化的流程」。手术后，这位肩部以下完全失去知觉的患者，仅凭植入大脑的芯片，便能在X上发帖，甚至还能玩《马里奥赛车》。但对应用而言，更现实的挑战，或许不是芯片，而在手术本身。

2026-01-02 13:38:00 80

原创「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

最后，在Loop变体中，模型采用了具有跨两次迭代共享参数的循环Transformer设计，用重复计算换取更高的参数利用率，在不线性扩大模型规模的前提下提升性能。公司成立于2012年，是中国较早一批专注量化投资和高频交易的私募机构之一，目前管理规模在数百亿元人民币，和幻方同属于公认的国内量化私募头部公司。在更困难的ARC-AGI 2上也拿到了16.0%。所以模型看到的并不只是某一时刻的完成态代码，还包括修改前后的差异、提交历史中的逻辑变化，以及真实工程中反复试错和修正的痕迹。大规模更新依然流畅；

2026-01-02 11:39:04 522

转载 AI正在占领你的视频推荐流

频道内容围绕一只拟人化的恒河猴，以及一个以绿巨人为原型的肌肉角色展开，两者与恶魔战斗、冒险，甚至还会乘坐由番茄做成的直升机四处旅行，Kapwing估算，该频道的年收入可达。雀实啊，自己花心思做出来的作品，一转眼就成了平台AI随手改的素材换谁谁也不乐意，而且认真创作的内容被平台AI直接拿去二次加工，本身就已经踩进了AI滥用的灰区。一方面，这些地区的创作者能够相对自由地访问主流社交媒体平台；是啊，AI内容几乎没有制作成本、上手门槛极低，又确实能赚钱，在这样的条件下，越来越多的人涌入其中，也就不难理解了。

2026-01-02 11:39:04 20

转载 DeepSeek改造何恺明残差连接！梁文峰亲自署名，十年首次重大升级

在27B参数的MoE模型上，mHC展现出稳定的训练曲线，最终损失相比基线降低了0.021，同时保持了与baseline相当的梯度范数稳定性。实验数据显示，这个近似解已经足够有效：在27B模型中，mHC的复合映射信号增益最大值约为1.6，与HC的3000形成了三个数量级的差距。DeepSeek团队的实验表明，在这三个映射中，负责残差流内部信息交换的Hres矩阵贡献了最显著的性能提升。论文提到，内部的大规模训练实验进一步证实了这些结论，且当扩展率n=4时，mHC仅引入6.7%的额外时间开销。

2026-01-01 18:32:07 73

转载老黄超200亿美元的推理闭环成型了

谷歌已经用TPU证明，GPU不是AI推理的唯一解，而老黄这波操作，就是要通过人才和技术的双重布局，对抗谷歌、博通的威胁。不仅将推理硅握在手里，连带着“TPU之父”Jonathan Ross领衔的核心团队一起，将90%的员工打包转入英伟达。最新瞄准的AI21，表面看是一家估值14亿美金的以色列初创公司，实则又是个“博士天团聚集地”。此前收购的Groq，它们的LPU使用的并不是HBM，而是速度极快，但内存受限的SRAM。三重收购、200个博士背后，是能让推理效率翻倍的技术，也是能对抗谷歌、博通的底气。

2026-01-01 14:15:00 34

转载 Hinton加入Scaling Law论战，他不站学生Ilya

而到了AlphaZero，DeepMind更进一步，彻底摒弃人类数据，仅通过“Zero”状态下的自我博弈，一天之内就让AI成为了“有史以来最厉害的国际象棋选手”。随着它的改变，系统的能力将会增强，安全问题将变得最为紧迫，这就是我们需要解决的问题。不过值得注意的是，哈萨比斯作为一位商业领袖、一位实打实的工程技术人员，他对Scaling Law的理解从来不止于“参数×数据×算力”的线性增长。再到后来，吵吵嚷嚷间，人们等来了Ilya创办的新公司，也是在这一阶段，Ilya开始试着回答——我们在Scaling什么？

2026-01-01 10:13:03 29

转载豆包一声声“OK”把罗永浩搞破防，不就是大型现场直播版图灵测试

锤子的交互创新是有，但不能掩盖硬伤啊，比如续航和发热问题，当年很多用户吐槽过的，这对手机来说很影响体验的OK。但仔细一想，豆包终究是个AI，能和一个以“能说会道”著称的人类在公开直播中辩论还不翻车，这背后没有足够硬的技术是做不到的。像这场辩论，模糊的立场、隐含的价值判断、设陷式的逻辑追问，以及持续施加的情绪压力，这是一种没有标准答案、只有博弈策略的开放式“压力测试”。最后啊，老罗在直播中还说了，对于那些一出门吵架就不会吵，回家之后就会突然想起来“哎呀，我要那么吵就好了”的人，那你就需要有个人跟你一起练。

2026-01-01 10:13:03 500

转载董事长稚晖君发布上纬新材首款机器人！能塞书包还能骑机器狗

在个人交互场景中，启元Q1接入启元灵心平台，支持自然语言对话、知识问答、英语教学和动作示范，并通过柔性阻抗控制，让人机交互更接近“可长期共处”的状态。这些产品在保持科研与开发属性的同时，更加关注体积、价格、耐用性和可玩性，而这，也意味着具身智能正从“实验工具”，逐步走向“可使用的产品”。其中醒目的1.88，既不是身高，也不是售价，而是启元Q1的体积（立方米）——一个被压缩到背包级的人形机器人尺寸。这次启元Q1的发布，可以被视为稚晖君此前探索的“机器人即服务（RaaS）”路径，在个人机器人市场上的一次延伸。

2025-12-31 19:10:52 64

转载马斯克买了新厂房上GPU，2GW供电规模，“巨硬”更更硬了

直到最近，有媒体援引房产记录披露，xAI的一家子公司从贝莱德旗下私募股权房地产公司ElmTree Funds的关联方手中，拿下了位于美国密西西比州Soso地区的一栋81万平方英尺的仓库。除了在建的发电厂外，Colossus II和最新MACROHARDRR还靠近田纳西河谷管理局运营的另一座燃气电厂、一条天然气管线，以及与田纳西州和密西西比州当地公用事业公司的连接。8月，Colossus II已经安装了119台风冷式冷水机组，提供约200MW的冷却能力，足以支持约11万个GB200 NVL72 GPU。

2025-12-31 13:28:23 37

转载黄仁勋「收购式」抢人继续：20多亿美金“买走”Mobileye创始人AI新团队

老黄看中的，正是这支拥有谷歌TPU原始基因、专攻低能耗AI推理芯片的顶尖团队，以此来直接补齐对抗谷歌TPU的短板，并消除一个潜在的竞争对手。所以他们首先在这两方面进行了尝试。通过这种“收购式招聘”，英伟达这样的巨头可以轻易躲过针对业务垄断的严格监管，直取“人”这个AI时代最核心的资产。远的不说，就拿老黄刚刚斥200亿美元巨资“拿下”的Groq来说，这笔交易的实质无疑就是一场经典的“收购式招聘”。直到现在收购的消息传出，加入老黄朋友圈的AI21 Labs，更是即将从亲密的“盟友”转变为真正的“家人”。

2025-12-31 13:28:23 31

转载 MiniMax作价461亿港元募资46亿，1月9日敲钟代码00100

我们觉得真正的AGI，一定要支持多模态的输入、多模态的输出，只是这件事实在太难了，三年多以前，我们刚开始做的时候，创业的时候，那个时候其实完全没有技术路线，我们的想法就是每个模态至少先走通，到了时机合适的时候就可以再起来整合。既有米哈游、阿里、腾讯、小红书、小米、金山、PCG和正大集团这样的战略投资人，亦包括高瓴、IDG、红杉、经纬、明势、云启等知名投资机构，累计融资金融超15亿美元（折合人民币约106亿元）。在这段5分钟的故事里，没有炫技，只有最真实、甚至有些狼狈的告白。

2025-12-31 13:28:23 147

空空如也

空空如也