- 博客(10812)
- 收藏
- 关注
转载 训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享
每家具身公司都有自己的采集技巧,所以如果没有注入任何技巧,即便拿到很好的UMI设备,采集的数据很像人的行为,但其实是废数据,基本上模型训练不了。当时我们就有一个愿景,希望能打破这个数据获取的这个不可能的三角,把非常高质量的数据砍到白菜价,加速应用来推进这个整个具身智能行业的发展。大多数情况下,要么训不出来,要么即使是在相似的条件下能跑出来demo,时间也非常短,可能就3、4秒,也很卡顿,不丝滑。大家会有误解,总觉得UMI数据就是人拿个夹爪,就把这个视频数据记录下来就行了,非常非常简单,所有人都可以做。
2026-01-08 20:08:04
4
转载 清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开
先挑了一批具有代表性的反思性词汇,比如「wait」「mistake」「however」等,由几位人工专家筛选、合并成一份最终词表,然后统计这些词在训练过程中出现的频率。听起来挺温情,但从LeCun离职风波的一系列「鸡飞狗跳」来看,小扎的「煲汤式招聘」,在为Meta带来成绩之前,好像先让内部文化出现了缝隙。不过,DeepSeek-R1虽然大幅提升了推理能力,但毕竟是开源模型,如果安全性工作做的不到位,很容易被微调后用于生成危险内容。冷启动数据怎么来的,两轮RL各自干了什么,奖励模型怎么设,全都写得明明白白。
2026-01-08 20:08:04
4
原创 开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!
或者模型又能否真的能被社区用起来,经得起复现、质疑和改造,在真实世界的任务中不断暴露问题,最终通过生态的反向推动,从而完成自我迭代与进化。在该任务中,WALL-OSS以41分的成绩领先pi0。因此,在面对未知环境或从未见过的任务组合时,WALL-OSS不再依赖预设流程,而是能够自主拆解问题、逐步思考,并在执行过程中动态调整策略,从而具备了承担长程、复杂具身任务的能力。在这样的背景下,一个可以在消费级显卡上完成训练、推理和部署的开源具身模型,在行业中的意义就不仅是共享成果,而是弥补了行业空白,实质性地。
2026-01-08 19:00:57
364
转载 智元首发SOP系统:打破离线训练瓶颈,让具身智能在“干中学”
在提升性能的同时保留泛化能力:传统的单机在线训练往往会使模型退化为只擅长单一任务的“专家”,SOP通过空间上的并行而非时间上的串行,在提升任务性能的同时保留VLA的通用能力,避免退化为单任务专家。当机器人被置于不同的环境时,即便是同样的任务,起初成功率和吞吐量如预期般下降,但在SOP介入仅仅几个小时后,机器人的性能便显著回升,能够鲁棒地执行相对复杂的实际任务。2025年机器人领域最火的VLA让机器人通过预训练具备了相当的通用性,但与此同时,机器人能否长时间,稳定,高效地完成任务仍是一个问号。
2026-01-08 19:00:57
5
转载 AI精准编辑门槛大降:开源框架提升编辑一致性,即插即用
结果就是:现有方法下,你想把“橙色猫”改写成“黑色猫”,AI可能还是给你一只橙色猫。该方法通过对注意力机制和初始噪声潜在分布的“精准手术”,实现了超高精度的图像与视频编辑,且完全无需训练、即插即用。在AI视觉编辑领域,如何在修改目标属性的同时,精准保留背景和非编辑属性的一致性,一直是个“鱼和熊掌”的难题。反演后的初始噪声中残留了太强的源图像分布信息,使得模型倾向于“重建”原图,而不是“编辑”新图。现有方法通过全局注入了过多的源图像注意力特征,导致模型更听源图像的话,而忽略了用户的编辑指令。
2026-01-08 19:00:57
5
转载 刚刚,智谱港交所敲钟!市值528亿港元
本次IPO引入11家基石投资者,涵盖北京核心国资、泰康人寿等头部险资、广发基金等公募,以及JSC International等国际机构,合计认购29.8亿港元,占发售股份近七成。智谱这面「全球大模型第一股」的旗帜,或许正标志着中国大模型,从 “技术跟跑” 正式迈向 “全球竞技” 的新阶段。全球范围内通用大模型企业第一次以这样的方式走向公开市场,非常有幸智谱作为中国大模型代表,站在这个历史性的起点。智谱的Z是字母表中的最后一个,代表终极境地,我们希望在AGI的探索历程上能走到智能的终极境地。
2026-01-08 09:37:45
5
转载 黄仁勋CES回应全场!内存卡了GPU脖子,游戏玩家可能只能用旧显卡了
他同时提出了“新型存储内存平台”的概念,还将英伟达定位为“全球最大记忆体买家之一”,认为其是横跨HBM、GDDR与LPDDR的关键需求引擎,指出随着AI工作负载规模急速扩大,对内存的需求早已不只是容量的竞争,而是系统层级的。预计,我们未来将具备生成几乎任何风格图像的能力,从写实风格,到极致写实风格,就是能以每秒500帧的速度,呈现出与你实时互动的照片级画质,再到你所喜爱的卡通渲染风格。他将英伟达比作AI产业的“船长”,引领着全球的供应链和合作伙伴,这份责任非常重大,他会一直做到“值得做”的那一天为止。
2026-01-07 17:11:16
16
转载 给AI打个分,结果搞出17亿估值独角兽???
除此之外,平台还采用了人机协同的评估模式,用人类的真实投票来反映大家对模型的偏好,再通过算法去平衡各个模型的出场次数、任务类型和样本分布,避免有的模型因为曝光多就被高估,或者因为曝光少就被低估,确保整个评估过程公平客观。在评分上,平台基于Bradley–Terry模型设计了Elo评分机制,每个模型都有初始分数,赢了就加分,输了就扣分,随着对战次数越来越多,分数会慢慢稳定下来,最终形成实时更新的排行榜。这时候大家不用管模型是谁,只需要根据回答的好坏投票选出更优的那个,系统在投完票之后才会揭晓模型的真实身份。
2026-01-07 17:11:16
8
原创 让欧美老外彻底“真香”,这家中国割草机器人品牌正在定义一个行业新标准
问题,小小机器人得知道现在具体的位置才能开始工作,而在真实的庭院环境中,定位要想稳定成立,首先得把活动范围划清楚——明确哪些地方能去、哪些地方不能去,避免机器人跑偏或越界,也就是要做定位部署工作。但叠起来也不是就高枕无忧,RTK能定位但吃亏在对信号要求高,Vision看得懂环境但怕光线和环境变化,雷达能感知环境和物体,但在啥都没有的空旷地,也会有点犯懵。我们来想象这样一个庭院场景:一侧是自家的草坪,另一侧可能紧挨着邻居的房子,中间有道路、篱笆、灌木,后面再接一块更大的草坪,看起来很规整,但细节其实非常多。
2026-01-07 15:11:03
454
原创 首家央企AI独角兽浮出水面!背靠自研大模型,4家国家队资本背书
这是对其成绩的认可。在此背景下,国家队身份的中电信AI公司,先是靠自研模型从既有技术霸权结构中破局而出,如今又通过增资进一步加码,联手四家跨资源国家队资本,全方位协同产业链,加速推动AI赋能千行百业。比起简单的融资,中电信AI公司这次,更像是借助「增资」,把分散在各个产业腹地的「江湖高手」攒到了一块,携手为国家队的道场坐镇,合力攻克单一企业无法解决的行业技术和产业的壁垒。说到底,国家队所追求的,不是短期的项目利润,而是通过技术赋能带动产业发展,通过产业发展培育出繁荣的AI生态,最终实现多方共赢的长期价值。
2026-01-07 14:09:20
504
转载 马斯克xAI又融了200亿美元!老黄说到做到投了更多
众所周知,Colossus I从无到有建成所有配套设施仅用了122天,至今仍是全球规模最大、运行状态最稳定的单一算力集群,配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72。而且这还没完,马斯克后面还搞了一个“巨硬计划”,去年底还为其专门买了代号“MACROHARDRR”的专属厂房,当时马斯克就扬言其供电规模将达到2GW。Anyway,无论是用户规模,还是算力储备、模型实力,这些都构成了吸引投资者目光的重要因素。这里还插播一则小故事。
2026-01-07 13:15:05
11
转载 8块钱跑通一次强化学习全流程,潞晨云重塑微调赛道:1名算法工程师=1支Infra团队
一旦底层资源可用,毫秒级启动,队列等待期间0计费,仅对实际prefill+sample+train的Token量收费,无资源闲置,将用户每一分钱都用在产生梯度的刀刃上。用户不再被底层繁杂的基建拖累,不再背负多职能的枷锁,也不再是黑盒填参的被动执行者,而是能够独立驾驭大规模训练流的主动设计师。强化学习涉及到更为复杂的系统设计,训练过程中存在一系列的问题,如多个模型的优化,数据的传递,以及模型权重的传递。之间落在最佳平衡点,将研究精力和算力成本从集群运维还原至算法本身,带给开发者“本地写码、云端计算”的。
2026-01-07 13:15:05
11
转载 港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了
分数当然是有意义的,但它所能解释的范围正在变窄,理解是否真正发生、思路是否连贯、判断是否经过取舍,这些关键环节,仍然被压缩成一个单一结果,难以被区分和看见。会直接决定AI的视力,一旦题目出现模糊、反光或拍摄角度偏差,再强的模型也只能在不完整信息上做推理,最终体现在答题表现上的,就是明显下滑的稳定性。从小学一路考到大学,我们最熟悉的考试,其实一直在反复确认同一件事,那就是有没有把老师讲的内容记住,以及能不能按标准方法,把题一步步算对。
2026-01-06 15:05:44
20
原创 陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能
比如将MiroThinker-v1.5-30B和1T参数的Kimi-K2-Thinking对比,不仅在BrowseComp-ZH测试中实现了4.5%的性能超越,在推理成本上,MiroThinker 1.5的单条调用成本更是低至$0.07,只有Kimi的1/20。传统大模型表面上看似是预测,实则只是在知识库里搜索结果并复述出来,或者是使用未来时间范畴的数据超前“剧透”,时序敏感训练沙盒则为模型戴上一个“紧箍咒”,严格约束只能使用当前可见的信息,并做出真实预测。它不靠全知,而靠会研究、会查证、会修正。
2026-01-06 13:48:30
286
原创 英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货
千呼万唤始出来,英特尔迄今最强AI PC处理器,正式开卖了——第三代英特尔® 酷睿™ Ultra处理器,首款基于Intel 18A制程节点打造。没错,就是那个被英特尔中国区董事长王稚聪比作重庆、被视为英特尔重回制程霸主地位的关键一役的18A。在现场,英特尔客户端计算事业部高级副总裁兼总经理Jim Johnson介绍说:这次的发布,意味着英特尔不仅兑现了制程节点的计划,更是直接把半导体制造带入了一个全新的维度。这款处理器除了提升了能效、增强CPU的性能之外,另一大看点就是集成了自家的Arc GPU。为什么这么
2026-01-06 12:20:00
742
转载 OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex
尽管我要离开OpenAl去尝试探索一些在OpenAl难以开展的研究领域,但这是一家特殊的公司,也是世界上一个特殊的存在,它已然在人类历史的长河中占据了永恒的位置。截至今日,Jerry在各种公开演讲和访谈中,多次强调对“推理”而不仅仅是“模式匹配式生成”的重视,倾向把大模型看作可以通过训练“学会思考过程”的系统,而不仅是一个黑盒文本预测器。我参与了GPT-4和ChatGPT的开发工作,最近还组建了一个团队,建立了一个新的缩放训练和推理计算范式——现在,它通常被称之为推理模型。我非常享受在这里工作的日子。
2026-01-06 12:20:00
18
转载 悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少
当时的问答机制非常高效,比如提问或者答案可以被投票,投票出来的高质量内容能够自然浮到顶部,贡献者会获得Reputation(声望值),这样一来,本质上是把技术影响力量化了。,不只是程序员专属,几乎覆盖了所有STEM领域,从编程到数学、物理、统计学,只要是技术相关的疑问,在Stack Overflow上都能找到同行探讨。从数据来看,Stack Overflow的问答数量一路下滑,直到如今跌破18年前的起点,在这其中,AI真得背锅。当初的程序员问答圣地,现在的提问数量甚至比18年前上线首月时的问题数量还要少。
2026-01-05 17:38:45
1121
4
转载 1人1假期,肝完10年编程量!马斯克锐评:奇点来了
比如谷歌首个Transformer推理,以及为核心服务提供的首批大规模TPU训练和推理交付模型,包括搜索中早期的大规模神经网络模型如RankBrain和DeepRank。如果我有编程Agent,尤其是Claude的Opus,我能把我前6年的工作压缩到几个月内。:可并行运行多个Agent,但每个Agent都在自己独立的代码库分支中工作,以避免冲突。在谷歌期间,他领导了Gemini模型的工作,对Gemini预训练做出了巨大贡献。整体来说,Claude在AI编程、编程Agent方面一如既往,担任着扛把子角色。
2026-01-05 15:04:14
34
转载 华为开源7B多模态模型,视觉定位和OCR能力出色,你的昇腾端侧“新甜点”来了
这款兼具轻量化、高性能与强通用性的多模态模型,既为端侧开发和个人使用提供了新选择,也将进一步丰富昇腾生态的应用场景,为创新注入新动力。整齐的三个token进行位置回归,不仅降低了模型学习难度,更显著提升了格式遵从性,让定位任务的精度和效率同步提升。这一设计让模型在训练中既能吃透长回复数据,也不忽视短回复信息,避免 “顾此失彼”,消融实验已充分验证其有效性。同时,采用多标签对比学习框架,让模型具备更优的细粒度理解能力,为后续VLM训练中的视觉定位数据学习筑牢基础。
2026-01-05 12:58:08
22
转载 融资35亿后,Kimi神秘模型现身竞技场
发现这个新模型的推特网友询问了模型的身份,结果模型自报家门,表示自己来自月之暗面Kimi,训练数据截止到2025年1月。营收规模实现数量级增长,产品和商业化上聚焦Agent,不以绝对用户数量为目标,而是追求智能上限,创造更大的生产力价值。让K3成为更 “不同” 的模型,垂直整合训练技术和产品taste,让用户体验到全新的、其他模型不具备的能力。这样一来,博主和帖子下面留言的网友们纷纷推测,Kiwi-do很有可能就是AMA中提到的K2-VL。
2026-01-05 12:58:08
25
转载 宇树IPO搁浅传闻满天飞,王兴兴:别当真,也不用和外人解释
近日,某媒体发布宇树科技上市相关报道(下称“该报道”),并被众多媒体、网络平台及自媒体大规模转载。据截图显示:王兴兴称:“好几周之前的,被人乱编的消息,又扩大了,大家别当真。相关报道表示:宇树科技A股上市的绿色通道被叫停,但仍可通过常规上市流程排队上市。从目前公开披露的信息来看,宇树科技的上市准备工作,整体仍沿着既定的合规流程推进。这一澄清,针对的是当日早些时候围绕宇树A股上市进程流传的相关报道。
2026-01-05 11:22:33
19
转载 字节Seed:大概念模型来了,推理的何必是下一个token
另一方面,此前基于潜在推理的框架,如大型概念模型(Large Concept Model, LCM)等,不仅需要单独训练编码器和解码器,还依赖人为划分的固定的、句子级别的粒度,缺乏拓展性与自适应性。由此,DLCM通过以上四个步骤,成功地将计算分配从低效的Token-Token交互,转移到高效的Token-概念-Token 交互,实现了计算资源的自适应、结构化利用。然而,在当前的LLM中,所有token被统一处理,信息密度不均匀的自然语言消耗了同样的计算量,造成了大量的冗余与模型容量的错配。
2026-01-04 19:00:00
27
转载 MIT新论文:2026推理模型过时了,“套娃模型”当立
这种机制实际上是在外部环境中构建了一个动态的、可编程的工作记忆空间,使得模型能够像操作数据库一样操作自然语言文本,在不改变底层神经网络权重的前提下,具备了处理极高复杂度长文本的逻辑推理能力。这种递归结构不仅实现了任务的并行化分解,更重要的是它支持多层级的深度推理,每一层递归都只需要处理当前层级的局部信息,从而确保整个处理过程始终维持在模型原本的上下文窗口限制之内。RLM允许模型在编写的代码中调用一个特殊的接口函数,该函数的作用是启动模型自身的一个新实例(或更小的子模型)来处理特定的子任务。
2026-01-04 17:06:18
43
转载 OpenAI首款硬件定型为笔!网友:就叫oPen吧
他认为今天的智能手机和电脑,本质上还是开/关的二元模式,你得主动点亮屏幕、打开App、敲指令、等反馈,整个过程充满了干扰:消息弹窗、切换窗口、注意力被不断打断,甚至还会带来一点隐形焦虑。从这个角度看,Altman早早拉Jony Ive入局,更像是一次非常清醒的判断:当OpenAI开始认真考虑做硬件,那就必须得让《专业的人干专业的事儿》。长期以来,OpenAI的产品都高度依赖Apple、谷歌、微软这些平台的硬件和生态,如果真想让AI成为用户日常里的第一交互层,只靠软件显然不够。
2026-01-04 15:24:57
23
转载 LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局
LeCun预计将在12个月内,见证该项技术的初始版本诞生,并在最近几年内实现大规模进展,虽然它显然还远远称不上超级智能,但至少在通往AGI的道路上,它存在希望。因为上头的压力,全组被迫放下手头正在做的工作,来Llama 4接烂摊子,距离发布ddl就剩2个月,还要处理所有dirty work。这一特征涌现现象,从记忆到泛化的突变过程入手,试图解释模型究竟学到了什么、和输入数据的关系、能达到怎样的泛化,也就是打开模型的黑箱。LeCun他们想要做些新东西,但小扎更想要已经被验证过的、可以直接落地的技术。
2026-01-04 13:18:48
18
转载 这里还有8个“Manus”:1亿美元ARR,都是ToC
成立于2022年,虽然并未对外披露1亿美元ARR的具体时间点,但在今年9月宣布启动1亿美元的员工股权回购计划时,正式宣布ARR已超过2亿美元,并预计年底前达到3亿美元。Lovable则是在2023年正式成立,并在今年7月正式宣布ARR破1亿,随后又在11月更新了这一数据,来到了2亿美元ARR,成为增长最快的AI编程工具之一。Meta有平台,有更强的触达能力还有更高效的流量组织。从Meta的视角出发,我自己在消费级AI产品上没有一个拿得出手的爆款,现在有一个经历过市场验证的Manus摆在我面前,价钱还不贵。
2026-01-03 18:00:00
26
转载 百度AI芯片公司冲刺IPO:出货量国产第二
基于这一架构,百度于2018年正式启动了昆仑芯项目——从FPGA转向AI芯片研发,并在当年的百度AI开发者大会上,拿出了首款基于XPU架构的云端AI芯片“昆仑1”。公开资料显示,欧阳剑本科毕业于北京航空航天大学,随后在中国科学技术大学获得硕士学位,长期深耕计算架构与高性能芯片方向,是一名典型的“工程师出身”的技术型负责人。同时,百度作为控股股东,可以将财务资源更集中于核心互联网业务,而让昆仑芯在资本市场上自主“造血”发展,实现母子公司双方的资源优化配置。一是价值层面,便于市场为其单独定价。
2026-01-03 14:13:24
50
转载 机器人也怕疼!港城突破性电子皮肤:主动痛觉 + 损伤自检双buff拉满
总体看来,NRE-skin 不仅是一种更高效的电子皮肤,更是一种具备自主感知、实时判断和自我保护机制的仿生智能系统,为未来制造更安全、更具人性化的仿人机器人奠定了坚实的工程基础。相比于以往的电子皮肤,NRE-skin没有继续沿用传统电子皮肤的“模拟信号采集”思路,而是模拟人类,直接把触觉转译成神经元式的脉冲信号。一旦压力超过阈值,系统会绕过中央处理器,直接触发类似脊髓反射弧的机制,实现毫秒级的即时保护动作(如缩回),大幅提升机器人的安全响应能力。电路层:对应人类的信号传导神经,NRE-skin的核心。
2026-01-03 14:13:24
36
转载 中国“人造太阳”突破密度极限,聚变点火迎来新路径 | Science子刊
在传统的实验观测中,一旦等离子体的线平均密度试图超过这一计算出的临界值,装置内的等离子体约束性能便会急剧恶化,进而引发剧烈的磁流体不稳定性,最终导致等离子体大破裂(Disruption)。随着靶板温度的降低,物理溅射被有效抑制,反馈系数维持在低位,密度上限将不再受制于格林沃尔德定标律,而是可以随着外部控制参数的提升而大幅增加,呈现出一种近乎“自由”的高密度运行潜能。如果无法厘清这一极限背后的物理本质,建立基于第一性原理的模型来替代简单的经验拟合,便无法确信未来的聚变堆能否在设计的高密度区间内安全稳定运行。
2026-01-03 12:44:21
24
转载 马斯克宣布:量产脑机接口,手术全自动化
但这层保护层也阻碍了医疗器械的植入。但对马斯克而言,Neuralink的版图中还有一片和医疗一样,广袤、神秘,且至今无人探索过的新大陆——赛博格。他认为,在ASI必然出现的那一天,人类只有拥有与硅基智能相当的高带宽接口,才不至于沦为「被圈养的宠物」。马斯克表示,到2026年,Neuralink的植入手术将升级为一种「高度简化、几乎完全自动化的流程」。手术后,这位肩部以下完全失去知觉的患者,仅凭植入大脑的芯片,便能在X上发帖,甚至还能玩《马里奥赛车》。但对应用而言,更现实的挑战,或许不是芯片,而在手术本身。
2026-01-02 13:38:00
80
原创 「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2
最后,在Loop变体中,模型采用了具有跨两次迭代共享参数的循环Transformer设计,用重复计算换取更高的参数利用率,在不线性扩大模型规模的前提下提升性能。公司成立于2012年,是中国较早一批专注量化投资和高频交易的私募机构之一,目前管理规模在数百亿元人民币,和幻方同属于公认的国内量化私募头部公司。在更困难的ARC-AGI 2上也拿到了16.0%。所以模型看到的并不只是某一时刻的完成态代码,还包括修改前后的差异、提交历史中的逻辑变化,以及真实工程中反复试错和修正的痕迹。大规模更新依然流畅;
2026-01-02 11:39:04
522
转载 AI正在占领你的视频推荐流
频道内容围绕一只拟人化的恒河猴,以及一个以绿巨人为原型的肌肉角色展开,两者与恶魔战斗、冒险,甚至还会乘坐由番茄做成的直升机四处旅行,Kapwing估算,该频道的年收入可达。雀实啊,自己花心思做出来的作品,一转眼就成了平台AI随手改的素材换谁谁也不乐意,而且认真创作的内容被平台AI直接拿去二次加工,本身就已经踩进了AI滥用的灰区。一方面,这些地区的创作者能够相对自由地访问主流社交媒体平台;是啊,AI内容几乎没有制作成本、上手门槛极低,又确实能赚钱,在这样的条件下,越来越多的人涌入其中,也就不难理解了。
2026-01-02 11:39:04
20
转载 DeepSeek改造何恺明残差连接!梁文峰亲自署名,十年首次重大升级
在27B参数的MoE模型上,mHC展现出稳定的训练曲线,最终损失相比基线降低了0.021,同时保持了与baseline相当的梯度范数稳定性。实验数据显示,这个近似解已经足够有效:在27B模型中,mHC的复合映射信号增益最大值约为1.6,与HC的3000形成了三个数量级的差距。DeepSeek团队的实验表明,在这三个映射中,负责残差流内部信息交换的Hres矩阵贡献了最显著的性能提升。论文提到,内部的大规模训练实验进一步证实了这些结论,且当扩展率n=4时,mHC仅引入6.7%的额外时间开销。
2026-01-01 18:32:07
73
转载 老黄超200亿美元的推理闭环成型了
谷歌已经用TPU证明,GPU不是AI推理的唯一解,而老黄这波操作,就是要通过人才和技术的双重布局,对抗谷歌、博通的威胁。不仅将推理硅握在手里,连带着“TPU之父”Jonathan Ross领衔的核心团队一起,将90%的员工打包转入英伟达。最新瞄准的AI21,表面看是一家估值14亿美金的以色列初创公司,实则又是个“博士天团聚集地”。此前收购的Groq,它们的LPU使用的并不是HBM,而是速度极快,但内存受限的SRAM。三重收购、200个博士背后,是能让推理效率翻倍的技术,也是能对抗谷歌、博通的底气。
2026-01-01 14:15:00
34
转载 Hinton加入Scaling Law论战,他不站学生Ilya
而到了AlphaZero,DeepMind更进一步,彻底摒弃人类数据,仅通过“Zero”状态下的自我博弈,一天之内就让AI成为了“有史以来最厉害的国际象棋选手”。随着它的改变,系统的能力将会增强,安全问题将变得最为紧迫,这就是我们需要解决的问题。不过值得注意的是,哈萨比斯作为一位商业领袖、一位实打实的工程技术人员,他对Scaling Law的理解从来不止于“参数×数据×算力”的线性增长。再到后来,吵吵嚷嚷间,人们等来了Ilya创办的新公司,也是在这一阶段,Ilya开始试着回答——我们在Scaling什么?
2026-01-01 10:13:03
29
转载 豆包一声声“OK”把罗永浩搞破防,不就是大型现场直播版图灵测试
锤子的交互创新是有,但不能掩盖硬伤啊,比如续航和发热问题,当年很多用户吐槽过的,这对手机来说很影响体验的OK。但仔细一想,豆包终究是个AI,能和一个以“能说会道”著称的人类在公开直播中辩论还不翻车,这背后没有足够硬的技术是做不到的。像这场辩论,模糊的立场、隐含的价值判断、设陷式的逻辑追问,以及持续施加的情绪压力,这是一种没有标准答案、只有博弈策略的开放式“压力测试”。最后啊,老罗在直播中还说了,对于那些一出门吵架就不会吵,回家之后就会突然想起来“哎呀,我要那么吵就好了”的人,那你就需要有个人跟你一起练。
2026-01-01 10:13:03
500
转载 董事长稚晖君发布上纬新材首款机器人!能塞书包还能骑机器狗
在个人交互场景中,启元Q1接入启元灵心平台,支持自然语言对话、知识问答、英语教学和动作示范,并通过柔性阻抗控制,让人机交互更接近“可长期共处”的状态。这些产品在保持科研与开发属性的同时,更加关注体积、价格、耐用性和可玩性,而这,也意味着具身智能正从“实验工具”,逐步走向“可使用的产品”。其中醒目的1.88,既不是身高,也不是售价,而是启元Q1的体积(立方米)——一个被压缩到背包级的人形机器人尺寸。这次启元Q1的发布,可以被视为稚晖君此前探索的“机器人即服务(RaaS)”路径,在个人机器人市场上的一次延伸。
2025-12-31 19:10:52
64
转载 马斯克买了新厂房上GPU,2GW供电规模,“巨硬”更更硬了
直到最近,有媒体援引房产记录披露,xAI的一家子公司从贝莱德旗下私募股权房地产公司ElmTree Funds的关联方手中,拿下了位于美国密西西比州Soso地区的一栋81万平方英尺的仓库。除了在建的发电厂外,Colossus II和最新MACROHARDRR还靠近田纳西河谷管理局运营的另一座燃气电厂、一条天然气管线,以及与田纳西州和密西西比州当地公用事业公司的连接。8月,Colossus II已经安装了119台风冷式冷水机组,提供约200MW的冷却能力,足以支持约11万个GB200 NVL72 GPU。
2025-12-31 13:28:23
37
转载 黄仁勋「收购式」抢人继续:20多亿美金“买走”Mobileye创始人AI新团队
老黄看中的,正是这支拥有谷歌TPU原始基因、专攻低能耗AI推理芯片的顶尖团队,以此来直接补齐对抗谷歌TPU的短板,并消除一个潜在的竞争对手。所以他们首先在这两方面进行了尝试。通过这种“收购式招聘”,英伟达这样的巨头可以轻易躲过针对业务垄断的严格监管,直取“人”这个AI时代最核心的资产。远的不说,就拿老黄刚刚斥200亿美元巨资“拿下”的Groq来说,这笔交易的实质无疑就是一场经典的“收购式招聘”。直到现在收购的消息传出,加入老黄朋友圈的AI21 Labs,更是即将从亲密的“盟友”转变为真正的“家人”。
2025-12-31 13:28:23
31
转载 MiniMax作价461亿港元募资46亿,1月9日敲钟代码00100
我们觉得真正的AGI,一定要支持多模态的输入、多模态的输出,只是这件事实在太难了,三年多以前,我们刚开始做的时候,创业的时候,那个时候其实完全没有技术路线,我们的想法就是每个模态至少先走通,到了时机合适的时候就可以再起来整合。既有米哈游、阿里、腾讯、小红书、小米、金山、PCG和正大集团这样的战略投资人,亦包括高瓴、IDG、红杉、经纬、明势、云启等知名投资机构,累计融资金融超15亿美元(折合人民币约106亿元)。在这段5分钟的故事里,没有炫技,只有最真实、甚至有些狼狈的告白。
2025-12-31 13:28:23
147
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅