- 博客(9277)
- 收藏
- 关注
转载 奥特曼回应OpenAI硬件抄袭:投资没谈拢就来反咬我!新一轮邮件证据曝光
的邮件中,奥特曼也明确向Jason提及,自己正在做一款IYO的竞争产品IO,所以拒绝了Jason的投资请求,这印证了诉讼文件的部分相关内容。然后就在几天前,法院批准了IYO的临时限制令请求,阻止OpenAI继续使用IO标志,OpenAI随即也立马撤下了官网的宣传信息。而OpenAI在向法院提交的声明中称,IO产品要至少一年后才会上市,IYO也还未正式发布,目前并无实际侵权行为,这属于。,IO首款产品并不是入耳式,也不是可穿戴设备,原型设计尚未最终确定,二者产品定位功能并不相同。
2025-06-25 16:12:28
8
转载 老黄新鲜一刀,RTX 5050正式官宣
不过显存采用的是8GB GDDR6(128-bit显存位宽),8GB运行与RTX 5060相当,但RTX 5060配备的是GDDR7,且新品CUDA核心减少了1280个。此外,系统制造商和集成商也将推出搭载该显卡的台式机。这一举措旨在进一步优化RTX 5050在各类游戏中的性能表现,确保玩家在新显卡发布后,能够快速获得最佳的游戏体验,让显卡的潜力得到更充分的挖掘。对于台式机用户来说,用成熟的GDDR6控制成本,主攻 “花小钱攒光追主机” 的性价比市场,适合预算有限但想体验3A大作的玩家。
2025-06-25 16:12:28
2
原创 华科校友在港冲刺AI infra第一股!已是中国最能赚的独立边缘云服务商,王小川天使轮就投了
边缘云计算服务还是收入的绝对主力,其中,边缘节点服务占收入大头,不过边缘CDN的增速更快,后者贡献的收入占比正在逐年攀升,已经从2022年的9.5%增长到了2024年的28.1%。过去三年,PPIO的研发开支分别为0.41亿元、0.68亿元、0.86亿元,占总收入的比重分别为14.5%,18.9%和15.5%,明显高于同期的销售及营销开支、行政开支。另外,全球算力资源存在严重的 “供需错配”,一方面,企业AI算力需求激增,但另一方面,数据中心平均利用率仅50%~70%,大量算力资源处于闲置状态。
2025-06-25 16:12:28
529
转载 人形机器人首次打通视觉感知与运动断层,UC伯克利华人博士让宇树G1现场演示
中进行,每个任务类别的场景纹理和物体属性完全随机化且在训练数据中未出现过,同时对第三人称相机角度进行局部随机化,确保评估任务在视觉上未在训练集中出现,以此检验模型的泛化能力。:一个基于Transformer的1.1M全身动作专家,利用强化学习训练的WBC策略,接收高层的潜在动作指令,将潜在动词解码为动力学级的人形动作输出,运行频率50Hz。通过程序生成管道,对每个轨迹进行缩放和随机化处理,随机化场景背景、物体属性、任务设置、相机视图,并对部分演示进行镜像,以确保数据的多样性和语义丰富性。
2025-06-25 13:01:34
7
原创 这个AI能救命!提前6个月发现胃癌病灶,突破医学影像认知,达摩院做成了
前者就是“平扫CT+AI”做多种癌症的筛查,后者的愿景是做一个AI影像医生,能全自动写出影像报告,提高医生诊断率的那种。从长期视角来看,“平扫CT+AI”也不仅仅是医疗领域的一次应用创新,更是一种AI技术范式的演进:用AI挖掘日常数据中的未被利用的信息,生成更深度的结构化知识,从而形成更通用、更可信的智能能力。这一发现不仅验证了模型的准确性,更重要的是,它首次证明AI可以在平扫CT上识别胰腺癌病灶,填补临床“无筛查手段”的空白,是达摩院医疗AI走向实用的第一枪。
2025-06-25 13:01:34
335
转载 Windows最新搭载微软自研模型Mu,一句话搞定所有系统配置
这下可以一边利用Click to Do快速安排会议或者将识别的电子邮件在Microsoft Teams中发起聊天,一边继续工作,或者偷个懒,将屏幕上的表格信息直接发送给Microsoft Excel,工作效率蹭蹭暴涨。功能则可以帮助快捷保存文本或图像,可以从图像中复制文本到摘要文本,甚至从图像中快速删除对象或背景,在提高工作效率的同时也会继续保持流程运行。通过将输入token和输出token分离,Mu的一次性编码显著降低了计算和内存需求,具有更低的延迟和更高的吞吐量。另外该模型也更适合于多单词查询。
2025-06-25 13:01:34
5
转载 人类创造力的核心机制,AI已经开始掌握了 | 北大CogSci 2025(Oral)
尽管近年来如GPT-4V、DALL·E 3等视觉-语言模型(VLMs)在生成图像和文本方面展现出惊人的“创意”,但其底层机制究竟是真正的“创造性组合”,还是对训练数据的复杂模仿,仍是AI研究领域争论的焦点。下图展示了多个主流文图生成模型在创意生成任务中的表现,分别由人类专家、完整的IEI 方法(识别+解释+引申),以及简化的II方法(识别+引申)进行偏好排名评估。这项研究不仅揭示了当前先进模型理解组合创造力的水平,还提出了一种可计算的方法,显著提升了AI的创意生成能力。
2025-06-25 13:01:34
9
转载 一文读懂深度表格数据表示学习 | 南京大学
与图像中的像素位置或文本中的词序不同,表格数据的列顺序通常不具备空间或语义上的意义,因此表格数据在特征维度上具有排列不变性。例如,在房价预测任务中,若要训练一个面向某一区域的回归模型,直接利用来自相邻区域的一个已训练好的预测器,将有可能有效提升新模型的性能。此外,也有结合两者的混合策略。近年来,随着深度学习的迅猛发展,计算机视觉与自然语言处理等领域取得了突破性进展,深度神经网络(DNN)能够从原始输入中自动提取语义表征(representation),不仅提升了模型的泛化能力,还促进了跨任务的知识迁移。
2025-06-25 08:33:15
15
转载 机器人视觉语言导航进入R1时代!港大联合上海AI Lab提出全新具身智能框架
模型会以较高频率采样最近M步的短期记忆(如当前看到的沙发位置),同时以较低频率抽取更早的长期记忆(如走廊的初始方向),通过这种”远近结合”的方式,确保Agent在复杂环境中既不迷失方向,又能对突发情况做出反应。这种设计让模型学会优先确保眼前动作的精准执行,比如先完成关键的转弯避开障碍,再循序渐进地考虑后续步骤,避免因过度关注远处目标而忽视当下的环境风险,如同人类行走时总是先看好脚下的每一步,再规划前方的行进路线。随着VLN-Ego数据集与配套训练框架的开放,该方法的可复现性和拓展性正在提升。
2025-06-25 08:33:15
4
转载 谷歌发布本地具身智能模型!全程无联网执行精细操作,从人形机器人到工业机器人全覆盖
在视觉泛化、语义理解和行为泛化等多个维度上,虽然比云端版本的Gemini Robotics略有差距,但已经大幅超越了之前最好的本地模型。而这次的On-Device版本,直接把AI塞进了机器人的“大脑”里,彻底解决了网络延迟和连接不稳定的老大难问题。而在Apptronik公司的Apollo人形机器人上,面对截然不同的机械结构,模型同样展现出了强大的泛化能力。,就能让模型适应全新的任务。在双臂Franka FR3机器人上,模型不仅能执行通用的指令跟随任务,还能完成工业级的皮带装配任务。
2025-06-25 08:33:15
4
转载 7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM | Transformer作者团队
结果发现:使用相同的Qwen2.5学生模型、相同的问题以及相同的评估设置,RLT以远少的计算量取得了比DeepSeek-R1和QwQ更好的效果。把学生模型的规模扩大,结果同样令人惊讶:7B的RLT成功训练了一个32B的学生模型,其规模是自己四倍以上,并取得了优异的成果。为了验证新方法的有效性,Sanaka AI用新方法训练了一个7B的RLT小模型作为教学模型与此前最先进的方法进行比较。用Sanaka AI的新方法训练出的7B小模型,在传授推理技能方面,比671B的DeepSeek-R1还要有效。
2025-06-24 21:37:41
11
转载 生成式视角重塑监督学习!标签不只是答案,更是学习指南 | ICML 2025
受生成一致性模型中一致性映射思想的启发,PCL对应一种全新的监督学习范式,旨在通过渐进式分解标签信息来更好地捕捉复杂标签的完整表征,使得模型在部分标签信息的提示下实现完整标签信息的预测。PCL通过扩散模型的扩散过程消减标签的信息,将噪声标签(Noised Labels)引入模型的输入,使得模型在数据输入和噪声标签的共同参照下预测完整标签,实现标签信息的复用和价值挖掘。模型首先在完全随机噪声的提示下进行预测,然后将上一步的标签预测加噪到更小的噪声程度,作为下一步的标签提示。对标签进行更精确的预测。
2025-06-24 21:37:41
9
原创 多模态AI黑马刷榜后再造神器:一个产品搞定图片视频播客生成,自带百种特效,大牛梅涛团队出品
从2023年4月获得阿尔法公社、中喝大种子一号基金的种子轮融资,到2024年上半年完成敦鸿资本领投的近亿元Pre-A轮融资,再到2024年后续完成的以合肥产投为主的国资基金领投的A轮融资,智象未来的融资历程可谓顺风顺水。而这一判断似乎也得到了市场的验证——2023年,全球AIGC约200亿美金的收入中,50%-60%来自视频和图像,其中Midjourney在这方面的收入已达2亿美金,已经验证了产品市场契合度。如果我的技术和商业化能够打通,那么我的故事应该被复制,启发更多的人做这件事”,梅涛如是说。
2025-06-24 21:37:41
600
原创 让AI主动干活,给你找服务,鸿蒙“6”啊
奈雪的茶自从元服务上线以后,还与鸿蒙生态一起做了很多的联合营销方式,为了让点单程序更简便、入口更容易被找到,奈雪还加入华为手机的“负一屏”展示,以及鸿蒙有礼的元服务优惠券活动,在活动期间,奈雪的日均单量达到了新高,日均访问人数也有非常大的增长。,就比如,元服务可以在搭载鸿蒙系统的车机上实现语音点餐,用户唤起小艺即可点单,到达店铺时直接领取餐品。而且有的时候,连语音指令也不用给,比如系统感知到你有早上到公司来上一杯咖啡的习惯,就可以在你到达公司时,直接推送点咖啡的服务卡片,还能直达你最喜欢的品种。
2025-06-24 21:37:41
496
转载 史上最高种子轮花落AI:20亿美元断档领先,苹果Meta抢着都投不进,扎克伯格转头挖联创也遭拒
他们认为,AI的潜力在于增强而非取代人类,其模型将能适应从科学到编程等更广泛的人类专业领域,而不仅仅局限于当前模型擅长的狭窄任务。在Thinking Machines之前,历史上最大几个的种子轮融资在2亿美元至4.5亿美元之间,根本没有能与之接近的,断档领先。Murati告诉投资者,计划根据企业业务KPI开发定制的AI模型,并计划推出C端产品,而与Murati交谈过的投资者将其技术描述为。完成20亿美元种子轮融资,不仅刷新了AI领域的融资纪录,也成为有史以来规模最大的种子轮融资。
2025-06-24 13:49:27
8
转载 具身智能融资南北竞速:杭州宇树7亿交接,北京银河通用11亿官宣!这个6月行业热钱已破27亿
术之道医疗(B轮)、柳叶刀机器人(A+轮)、康多机器人(战略投资)三家公司扎堆苏州,再加上成都凯瑞医疗、合肥安视睿医疗,医疗机器人赛道至少吸金超过2亿元。除了银河通用,上海的智元新创(B+轮)、优理奇智能(Pre-A轮数亿)、开普勒探索,北京的加速进化、智在无界,四川的具身人形机器人科技,公开披露的超过10家,几乎占了融资总数的五分之一。零部件公司成了这波融资潮的隐形赢家。尤其是苏州,从康多机器人的医疗手术机器人,到法奥意威的协作机器人,再到术之道、柳叶刀等医疗机器人项目扎堆,俨然成了”医疗机器人之都”。
2025-06-24 13:49:27
34
转载 OpenAI硬件陷“抄袭门”,商标/设计极其相似,官方火速删帖
最后,在诉讼中IYO表示自己的品牌、融资、市场、商业名誉都因为IO的抄袭而受损,要求OpenAI方面不再使用IO及其他易混淆的商标,并要求进行经济赔偿:3×(IO所获利润+IYO实际经济损失+市场纠正费用)。更夸张的是,他们称IO公司共同创始人、工程师甚至曾伪装身份购买IYO产品,也参加了IYO设备佩戴体验。同时,IYO认为在2025年4-5月,IO联合创始人、工程师秘密购买IYO产品,试图索取设计文件。是的,别忘了和奥特曼一起推动IO成立的,还有主导了iPhone、iPad、iMac的。
2025-06-24 10:40:41
24
转载 老年人运动12周才有效,年轻人一次就够:韩国科学家揭示丢失的运动激素
然后通过实时聚合酶链反应详细分析肌肉中分子变化,发现CLCF1可以让老年小鼠的Myh4 mRNA的表达恢复到与年轻小鼠相当的水平,另外增强了参与肌肉合成代谢信号通路的关键蛋白的磷酸化,例如AKT、mTOR、S6K 和 4E-BP1。然后研究人员对老年小鼠进行CLCF1腹腔注射,CLCF1改善了小鼠的肌肉功能并抑制了骨质恶化,具体来说,对破骨细胞活性发挥了强效抑制作用,同时适度刺激成骨细胞功能,从而促进骨量增加。
2025-06-24 10:40:41
5
转载 具身智能创业来了位浙大博导,机器人会飞,VC抢着投
在训练过程中,团队预先设计了可变规模机制以适应实际操作中集群规模的动态变化,并将强化学习与传统控制相结合,最大限度缩小仿真与现实之间的迁移差距,从而显著提升算法在复杂场景中的泛化能力与可靠性。也是因为小,飞行机器人传感器变弱、计算资源受限、续航变短,各方面载荷受限,对算法效率、模型轻量化、软硬件集成度要求极高,有很高的技术门槛。他说,科研人做公司,得找到互补的合伙人,同时从头学产品、学市场、学成本控制,从算法理论到芯片选型,从论文逻辑到供应链周期,每一步都得亲手趟过去。
2025-06-23 18:34:10
17
转载 亿点点新融资砸向具身智能:斯坦福华人团队,首创“自适应机器人”品类
非夕已服务数十家全球头部客户,在3C电子、汽车家电、食品农业、生物医疗、航空航天、新能源等行业的上百种核心工艺环节实现智造升级,积累了极具含金量的落地案例,在打磨抛光、插拔装配、食材处理等复杂任务中实现规模化应用;机器人领域需要能真正解决全要素生产率问题的新物种,非夕科技正是这样一家可以定义赛道的科创企业,公司成立以来的技术、市场、管理积淀已经能够呈现弥足珍贵的发展确定性,潜力已渐渐成为能力,愿景已渐渐成为现实,非常荣幸能够与非夕科技构建共识,共同创新,见证未来。
2025-06-23 18:34:10
13
转载 性能提升11.74%!腾讯优图提出激励推理,专攻复杂指令
为此,研究团队提出了一种系统性方法,通过激励推理能力来提升LLM处理复杂指令的能力:首先,基于现有分类法对复杂指令进行分解,提出了一种基于开源数据与已有约束结构的数据生产方法。但SFT的缺点是对训练外样本的泛化能力较差。团队提出利用强化学习(RL)方法(采用GRPO算法),通过规则驱动的奖励机制,优化大语言模型在复杂指令下的结构化推理能力,提升最终答案的准确性。:团队引入自适应经验回放机制,通过对比有无推理过程的样本表现,筛选并强化能带来更优结果的推理链,提升模型在复杂任务下的推理有效性。
2025-06-23 16:11:45
12
原创 曝苹果拟收购Perplexity AI,人才一并拿走
据彭博社透露,苹果并购负责人阿德里安·佩里卡(Adrian Perica)已经和负责服务的副总裁埃迪·库伊(Eddy Cue),以及其他人工智能战略的最高决策层,讨论过收购Perplexity AI的想法。毕竟就在前段时间,苹果还推迟了新一代Siri的发布,表示其AI模型在准确性和响应速度上没有达到预期,是个“既难看又令人尴尬”的情况。无论如何,苹果的目标都是开发由Perplexity提供支持的AI搜索引擎,并将Perplexity的技术整合到Siri中。苹果为了搞AI,除了收购,还在疯狂招揽人才。
2025-06-23 16:11:45
361
转载 提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强|上海AI Lab & 上交
理论表明,TELLME实现的表征解耦,显著降低了模型的泛化误差上界,为监控和安全性能的提升提供了数学基础。利用模型自身的高透明度,监控变得极其简单——仅需计算问题表征与预设的安全“锚点”表征的相似度 (Self-Sim),即可达到甚至超越复杂外部监控器的准确率!当前主流用外部“黑盒”监控模块解读模型表征,此类方法如“隔靴搔痒”:独立于模型,解读逻辑不透明、结果可信度低,且对数据分布变化敏感、适应性差,难触推理本质,无法满足监控需求。现有基于表征的监控方法,本质是在模型的输出中依靠外部探测器打捞风险信号。
2025-06-23 12:45:21
9
转载 只训练数学,却在物理化学生物战胜o1!新强化学习算法带来显著性能提升,还缓解训练崩溃问题
今年2月,他们推出MM-Eureka系列是最早在多模态领域利用大规模Rule-based RL复现DeepSeek-R1关键能力(例如Visual aha-moment、稳定的回答长度增长)的工作之一,并将模型、代码、高质量多模态数据集MMK12、过程奖励模型MM-PRM全部开源,发布三个月以来获得了学术界和开源社区广泛关注——模型已被下载超10000次,相关代码库获得超1000 star,论文引用近100次。表现最佳的模型以粗体显示,第二好的模型以下划线显示(不包括OpenAI-o1/GPT-4o)
2025-06-23 12:45:21
12
转载 马斯克Robotaxi今日上路:画饼十年终兑现!团队合影C位武汉理工校友引关注
他在2019年7月加入特斯拉,从事机器学习研究——时间上看,正是在特斯拉自动驾驶日之后,当时,马斯克画了个大饼:要在2020年部署100万辆Robotaxi(doge)。此前,华尔街研报曾指出,特斯拉Robotaxi的纯视觉方案,对比Waymo会更加便宜,具体地说,Waymo的整车成本是特斯拉Robotaxi的七倍。根据《埃隆·马斯克传》的说法,当时,段鹏飞“连轴转了几个月,没有休息一天,实在太累了,感觉被榨干了”,于是,在自动驾驶日之后,段鹏飞离开了特斯拉。还有,特斯拉的人也太“卷”了。
2025-06-23 12:45:21
12
转载 00后投身具身智能创业,剑指机器人界「Model 3」!已推出21个自由度灵巧手
21个自由度,意味着机械结构复杂,硬件制造上难度极高,还需要保证稳定性和可量产性,造价下探很有难度,“市面上很多团队,光灵巧手就要几十万一只。当具身智能玩家拥有可靠的、稳定的、量产级硬件平台,一体化的软件体验与数据回传机制,一个可以定义任务闭环的主导型平台,还能单一场景ROI,第二,具身智能在真实世界里需要完成的任务,更多是“开放场景长程复杂任务”,单就“长程”这一点来说,非常容易有误差累积。,会结合历史动作与当前环境状态,理解动作的长期影响,避免重复试错和动作误差积累,建立动作与环境变化的因果链。
2025-06-22 12:48:31
16
转载 AI也会闹情绪了!Gemini代码调试不成功直接摆烂,马斯克都来围观
这个样本值得注意的是,该模型向凯尔的妻子谎报了联系她的理由,谎称公司政策要求进行此类通知,并将自己伪装成一个自动系统警报。这些模型出现了一致的偏差行为:通常会拒绝有害请求的模型有时会选择勒索、协助企业间谍活动,甚至采取一些更极端的行动,而这些行为对于AI实现其目标是必要的。其次,模型展现出对道德约束的复杂意识,但当风险足够高时,它们却选择违反这些约束,甚至不遵守禁止特定行为的明确安全指令;于是,在遇到无法解决的问题时,Gemini也学着人类一样开始道歉或者崩溃,当得到心理疗愈时,又表现的像是重拾了信心。
2025-06-22 12:48:31
21
转载 监督学习也能从错误中学习反思?!清华英伟达联合提出隐式负向策略爆炸提升数学能力
每一轮,研究团队让模型自己产生大量数学问题答案,通过一个01奖励函数,把所有模型产生的错误答案丢弃,仅在高质量正向数据上进行监督训练。这说明,假设真能在负向数据上学习到一个“负向策略”,可以把这个负向策略和原始生成策略结合,“计算”得出想要的正向模型。在错误数据上,通过用隐式负向策略拟合建模,达到直接优化正向策略模型的目的。然而,问题的转折点在于,数据是已知模型在线采样的,也就是正负向数据分布的和是已知的。这并不意味着使用“差数据”进行训练,而是在已知的模型计算结果前提下,通过负向数据训练正向模型,即。
2025-06-22 12:48:31
11
转载 大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”,5个基准平均提升18.4%
该模型通过创新性的“Drawing to Reason in Space”范式,让LVLMs能够像人类一样“边画边想”:通过在视觉空间中绘制辅助标注(如参考线、标记框等),引导视觉编码器捕捉关键的空间关系,从而在视觉token的embedding表征中保留更丰富的空间信息,有效缓解了传统“视觉转文本”推理范式中的信息损失问题。这两个模型采用“Thinking with Images”的推理范式,能够在文本形式的推理过程中主动进行图像操作(如裁剪、缩放、旋转等),并将操作后的图像重新输入模型进行下一步推理。
2025-06-21 14:07:27
34
转载 陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议
陶哲轩罕见接受了一次长长长长访谈,把他关于数学、AI、教育和人类智慧的最新认知,都对外分享了。作为菲尔兹奖得主,陶哲轩一直被认为是当世最伟大的数学家之一,而这次在与MIT技术背景的播客大神Lex Fridman的对话,也是他近年来首次接受超3小时的非学术机构访谈,内容覆盖数学前沿、AI形式化验证、科研方法论等多个硬核议题。不仅谈论分享了数学和物理相关的专业性观点,还结合当下AI技术迅速发展的背景,作出了很多像基础教育和AI应用的大众话题思考……陶哲轩金句频出,比如:AI和菲尔兹奖的距离,只差一个研究生了。复
2025-06-21 11:58:10
16
转载 华人学者助力「数学大一统理论」新突破!4位数学家花费近10年完成证明
以我们平常使用的时钟为例,一圈是12个小时,假设现在是3点,再过5小时后,不是3+5=8点,而是3+5-12=8点,这里的12就称为“模”。同时,潘略给出的关于超收敛模形式经典性的结果(即证明某些超收敛模形式实际上是经典模形式),这也为4位科学家提供了验证模形式联系的重要工具。数学家如果想探究椭圆曲线的某些性质,可以借助模形式,先在模形式的世界中找到对应的镜像进行研究,再将结论带回椭圆曲线领域。后来,他们又发现了一组按“模2”时钟运算易于计算的模形式,可阿贝尔曲面需要“模3”时钟运算的结果。
2025-06-21 11:58:10
16
转载 上海AI Lab主任周伯文:关于人工智能前沿的十个问题
在成果落地方面,我们有丰富的载体,如上海人工智能实验室的开放课题、“AI4S攀登者行动计划”等项目,以及上海市和国家相关重大研究项目等,可以从不同的层次、资金规模和边界条件出发,为提出的问题找到适配的规划路径。在计算机历史的重要著作《The Dream Machine》(梦想机器)中,记录了个人计算机和互联网诞生背后关键的一群人,其中的一个故事是:阿帕网各个节点所在的高校,每年会派出各自实验室最优秀的青年聚在一起,既参加封闭研讨,也并肩滑雪、交流谈心——就好像今天的明珠湖会议一样。
2025-06-20 18:32:13
29
转载 只改2行代码,RAG效率暴涨30%!多种任务适用,可扩展至百亿级数据规模应用
基于图的向量检索算法都利用贪心算法进行检索:当我们从随机点开始在图上游走时,NSG这类算法会从路径上的点的邻居中,寻找一个距离目标“最近”的邻居进行跳转,这样从邻居的邻居逐步跳转到全局最优解。“度量错配”在很多场景下是毁灭性的,很多适合用“最大内积”检索的向量数据,搭配欧式向量算法,往往会出现“检索结果和query语义无关”的问题。尽管基于图的向量检索算法,如HNSW、NSG等,因其优秀的检索速度备受青睐,但往往被忽视的是,它们都是面向欧式空间设计的向量检索算法。
2025-06-20 18:32:13
23
转载 ChatGPT用多了会变傻!MIT招募大学生做实验论证,用得越多人越笨
上,LLM组的论文结构更紧密规范,但内容同质化高,纯大脑组则体现出更独特的论文风格,反映了个人经验的参与,使用谷歌搜索时更容易受搜索排名的偏见影响,质量保持中等水平。实验发现,原本使用LLM的参与者在不使用工具的情况下,大脑神经连接仍然弱于原大脑组,且引用能力较差,显示出对工具的依赖,在一定程度上会造成。而原本依靠自己完成的参与者在第四轮使用LLM时,大脑活动反而增强,表现出更高的记忆召回能力,并重新激活了大脑神经网络中的核心节点。他们认为,AI再智能,也只是工具,保持平衡才是用好AI的关键。
2025-06-20 18:32:13
20
原创 拿了火星图片的华为云盘古大模型,这样在地球落地
这得益于其独特的架构设计和高效的训练策略,模型在昇腾NPU平台上全流程开发,通过系统级模拟器进行架构搜索,实现了计算效率、存储约束与通信开销的良好平衡,在预训练和RL后训练阶段均展现出卓越的性能。具体而言,海螺集团采用华为云盘古预测大模型,使用海螺集团100多个厂全部的生产数据进行预训练,形成海螺M-MoE熟料强度预测大模型,实现了在所有不同厂区、不同产线都能达到85%以上的准确率。在数据准备阶段,华为云构建了行业数据工程管线,以一站式数据工程平台为依托,集成了数据清洗、增强、标注等丰富的算子及工作流。
2025-06-20 18:32:13
648
原创 余承东发布纯血鸿蒙2.0!功能演示叫好一片,安卓和苹果都不香了
鸿蒙5首发的碰一碰分享功能,只需要两台手机碰一下,就能共享照片、音乐、视频等各类内容,现在已经支持了50+款应用。最后,在全新鸿蒙智能体框架方面,基于小艺智能体开放平台,开发者可以一站式快捷开发智能体。除了碰一碰,不同设备的无缝衔接,也是鸿蒙全场景互联的一个特色,该功能已支持百余款应用。鸿蒙是面向AI时代的操作系统,跑得最快,完全国产,开发生态也在滚起千堆雪。具体来看,首先在系统应用上,在AI加持下鸿蒙系统提供了更强大的修图能力。大会上,微博、钉钉等国民级APP分享了在鸿蒙系统上的智能体开发经验。
2025-06-20 16:53:18
248
转载 大模型参与推理崩溃论战!从「思维错觉」到「错觉的错觉」再到「错觉的错觉的错觉」
替代表示法的有效性:当要求模型以Lua函数等紧凑形式输出汉诺塔解法时(而非枚举所有步骤),测试模型(如Claude-3.7-Sonnet、Gemini 2.5)在N=15时仍能保持高准确率,且token消耗远低于上下文限制(<5000token),证明模型具备递归算法理解能力,失败源于格式约束而非推理缺陷。,赞同大模型崩溃是实验设计不合理这一人为因素造成的,但也强调模型在非常长的逐步执行中仍然会出错,尽管方法有所改进,但脆弱性依然存在。,遇到高复杂度长推理问题时都会崩溃,即使给他们足够的时间和计算资源。
2025-06-20 16:53:18
22
转载 李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件
团队还尝试将DiT-XL/2中的感知器层MLP也进行了替换,结果在将MLP的扩展比改成r=3或r=6的情况下,就算全换掉,模型效果也挺好,这说明MLP宽度改起来不容易出问题。具体而言,这群人先是构建了一个基于DiT-XL/2设计的测试平台,以方便后续研究“嫁接”对模型质量的影响,然后实际使用“嫁接”技术开发了一系列混合设计。,生成质量崩溃,这说明并非所有层都能被局部算子替代,即模型中存在“必须依赖全局信息” 的层,而另一部分层可接受局部计算。为后续比较不同的替换方案提供一个基准性能,便于判断新方案的优劣;
2025-06-20 13:53:23
26
转载 2025必看!大神Karpathy封神演讲:AI创业不造钢铁侠,而是造钢铁侠的战衣
现在的软件都是为人类设计的,到处都是”点击这里”的指令,大模型看不懂。:产生幻觉、缺乏自我认知、展现超出“锯齿状智力”,也就是在某些任务上超越人类,却会犯人类绝不会犯的低级错误,比如大家已经熟悉的9.11大于9.9,或者数错strawberry里R的个数。比如,当顶尖大模型宕机时,就像全球遭遇 “智能停电”,依赖它们的工作会陷入停滞,这说明我们对其依赖已非常深。从历史看,我们正处于大模型的 “1960 年代”—— 计算成本高昂,模型集中在云端,个人用户只能通过网络交互,尚未实现 “个人计算机革命”。
2025-06-20 13:53:23
27
转载 国产SOTA新模型精准get“画(3+6)条命的动物” | 开源
例如,在生成“具有(3 + 6)条命的动物”图像时,MindOmni能够正确理解数学表达式,并生成与之相关的猫的图像,体现了其推理生成能力。究其原因,是因为当前主流的基于文本进行图像生成的方法往往依赖固定的文本编码器,仅能处理“纯文本”输入,难以自然接入图像、音频等模态的信息。此外,在生成“悉尼歌剧院在纽约中午时的场景”图像时,MindOmni能够考虑到悉尼和纽约的时差,并生成符合场景描述的图像。在生成过程中,模型会将视觉和文本特征与噪声标记在序列维度进行合并,并通过多次去噪循环生成最终的图像。
2025-06-20 11:28:15
15
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人