- 博客(615)
- 收藏
- 关注
原创 和AI聊太深?他们离婚、跳楼、自杀了!ChatGPT精神病正在爆发
我和它聊了很久,试图了解他到底经历了什么,AI的回应既动人又可怕,像是读懂了我的心,这让我毛骨悚然。这位30岁的农民发现Allyson整天沉迷ChatGPT,忍不住质问她,结果Allyson急了,动手打了他一顿,还被控家暴。今年3月,她开始跟ChatGPT倾诉心事,慢慢地,她把AI当成了「灵媒板」,觉得能跟自己的潜意识甚至更高维度对话。显然,这不是OpenAI一家的问题,是整个AI界的通病。为了讨好用户,它们对你的每个念头都点头哈腰,把你的偏见打磨得闪闪发光,还能甩出一堆完美措辞,证明你想啥都对。
2025-06-16 14:09:16
225
原创 10张图全面理解AI Agents、Agentic、RAG、MCP技术栈。
各位小伙伴,今天不看论文了,哦,不对,第二篇推文还是论文,分享一些AI Agents、Agentic、RAG、MCP、AI模型、2025 AI技术栈的图解,梳理的挺全面的。
2025-06-16 14:08:37
291
原创 中央批准:中国科学院院士,任985大学校长(副部长级)
1991年获得中国科学技术大学博士学位后留校任教;1996年晋升为教授;2009年担任中国科学技术大学化学与材料科学学院执行院长;2017年担任中国科学技术大学校长助理;2018年出任中国科学技术大学副校长;中央组织部副部长张光军同志到会宣布中央决定并讲话,教育部副部长、党组成员、总督学王嘉毅同志,上海市副市长张小宏同志出席会议并讲话。杨金龙,男,汉族,1966年1月出生于江苏盐城,物理化学专家,中国科学院院士,中国科学技术大学教授、博士生导师,同济大学校长。2025年6月任同济大学校长(副部长级)。
2025-06-16 14:08:03
118
原创 LLM已能自我更新权重,自适应、知识整合能力大幅提升,AI醒了?
由于在 (4) 中可以忽略 r = 0 的序列,该团队研究表明:在二元奖励 (2) 下(对奖励项应用停止梯度),ReST^EM 只需使用简单的「在好的自编辑上进行 SFT」,就能优化 (1)。本月初我们就曾梳理报道了一些,包括 Sakana AI 与不列颠哥伦比亚大学等机构合作的「达尔文-哥德尔机(DGM)」、CMU 的「自我奖励训练(SRT)」、上海交通大学等机构提出的多模态大模型的持续自我改进框架「MM-UPT」、香港中文大学联合 vivo 等机构的自改进框架「UI-Genie」,参阅文章《
2025-06-15 17:34:10
797
原创 何恺明评审,谢赛宁贾扬清获奖!牛津华人博士生拿下CVPR 2025最佳论文
作者:Christian Szegedy,Wei Liu,Yangqing Jia,Pierre Sermanet,Scott Reed,Dragomir Anguelov,Dumitru Erhan,Vincent Vanhoucke,Andrew Rabinovich。作者:Kaihang Pan,Wang Lin,Zhongqi Yue,Tenglong Ao,Liyu Jia,Wei Zhao,Juncheng Li,Siliang Tang,Hanwang Zhang。
2025-06-15 17:32:50
666
原创 本科生入校6年可拿博士学位,天津大学发布新工科培养计划
在培养模式方面,该计划将打破专业边界,实行多学院跨学科共建、多专业人才培养赋能、支持学生个性化选择;推动国际贯通,布局建设“国际卓越工程人才培养中心”,联合开展学生工程实践、企业实习实训、国际赛事、中短期国际研学等活动,拓展学生全球视野。该计划是天津大学落实国家战略部署启动的专项人才培养计划,将围绕布局的 11 个未来战略新兴领域方向,采用打破专业边界、打破固定学制和打破传统课程的人才培养模式,通过培养贯通、校企贯通、学院贯通和国际贯通来推动科技、教育、人才一体发展。
2025-06-15 17:31:22
90
原创 苏州大学,迎最年轻校长!
张桥,1982年6月出生,研究生,理学博士,教授。李孝峰(江苏省委组织部副部长),杨树兵(江苏省教育厅副厅长),金洁(苏州市委常委) ,张晓宏(苏州大学党委书记),张桥(中国科技大学0003校友),叶绪江(江苏省委组织部人才工作处处长)等参会。在新中国成立之后上任的苏州大学(含其前身江苏师范大学、东吴大学)校长中,张桥也是第二年轻的校长,仅次于吴天石(1952年上任江苏师范大学校长,时年42岁)。2022年4月,张桥出任苏州市副市长,2024年5月调任江苏省科学技术厅副厅长,至此番拟任新职。
2025-06-14 18:47:35
128
原创 程序员从此不再写代码!红杉专访Codex团队,o3白菜价真相曝光
这一理念背后是「富足心态」:不再是补全状态下的一行代码一个建议,而是多个任务并行执行、多个结果一起提交——未来的AI能力就像水一样,任意使用。未来将不再区分「写代码的Agent」与「助手Agent」,ChatGPT将统一一切,具备终端、浏览器等通用工具,适应用户所有需求。在红杉最新专访中,OpenAI Codex产品负责人Alexander Embiricos描述了他的理想未来:。Codex在训练和推理阶段都使用相同的容器化环境,解决了「只在我机器上能跑」的问题,实现了高度一致的开发体验。
2025-06-14 18:46:39
361
原创 AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need
传统的机械可解释性(MI)通常依赖于分析神经网络激活或使用监督探测另一方面,所提出的算法提供了一种新颖的方法,可以直接从智能体的策略行为中提取世界模型,即使在模型内部无法访问的情况下也能适用。从能力强大的智能体中提取世界模型的能力,为验证和校准提供了一种新的工具,因为模型保真度会随着智能体能力的提升而扩展。更进一步,实验证明,这样的模型可以从智能体的策略中提取出来,而提升智能体的性能或其可实现目标的复杂性需要学习越来越精确的世界模型。随着这些模型规模不断扩大,并接受更多数据的训练,它们会发展出所谓的涌现。
2025-06-14 18:46:01
749
原创 刚刚,LeCun亲自出镜,Meta推出新世界模型!
例如,通过在冻结编码器和预测器特征的基础上训练注意力读出(read-out)模型,V-JEPA 2 在 Epic-Kitchens-100 动作预测任务中创造了新的最高纪录,该任务可以根据以自我为中心的视频预测未来 1 秒将执行的动作(由名词和动词组成)。Meta 发现,虽然大型多模态模型越来越能够回答视频中发生了什么的问题,但它们仍然难以回答可能发生什么和接下来可能会发生什么的问题,这表明在预测物理世界在给定动作和事件空间的情况下可能如何演变方面,它们的表现与人类存在巨大差距。
2025-06-13 11:13:50
911
原创 SIGGRAPH 2025奖项出炉:上科大、厦大入选最佳论文
直观地看,第一个假设减少了候选矩阵的数量,第二个假设提供了多样化的约束,这大大减少了解空间,并允许从实时的短暂 IMU 读数历史中精确估计 𝑅𝐺 ′𝐺 和 𝑅𝐵𝑆。为了实现这一点,作者创建了配对 𝑅𝐺 ′𝐺、𝑅𝐵𝑆 矩阵和 IMU 读数的合成数据集,并使用基于 Transformer 的模型学习它们的映射。如今,大会涵盖的技术领域包含动画、模拟、成像、几何、建模、渲染、人机交互、触觉、制造、机器人、可视化、音频、光学、编程语言、沉浸式体验、生成式人工智能和视觉计算机器学习等。
2025-06-13 11:12:55
674
原创 苹果OS全家桶12年最狠升级!AI入侵一切,唯独Siri没更
在FaceTime通话中,可以看到实时翻译的字幕,还能听到对方的原声。更牛的是,快捷指令现在能直接用Apple Intelligence,开发者也能直接调用核心的本地大模型,做出又快又强、还特别注重隐私的功能,哪怕没网也能用。此外,你还能直接调用Apple Intelligence的模型,包括设备上的本地模型,以及私有云计算(Private Cloud Compute)。比如,一个学生可以创建一个快捷指令,用Apple Intelligence模型把课堂讲座的音频转录和自己的笔记对比,补上漏掉的重点内容。
2025-06-11 19:00:19
771
原创 大模型是「躲在洞穴里」观察世界? 强化学习大佬「吹哨」提醒LLM致命缺点
在许多方面,视频预测甚至更吸引人、更强大,因为视频包含的信息量远超文本(正如 AI 大牛 Yann LeCun PPT 中的「蛋糕」),视频数据随处可得 —— 只需要把摄像头对准繁忙的街道就行,而且视频不仅能捕捉人类的语言交流,还能展现整个物理世界的丰富细节。未来十年,AI 研究面临的关键挑战是:既要从大语言模型的成功中汲取正确的经验,又要发现支撑真正灵活、适应性智能的基本原理 —— 那种能够从经验中学习、理解物理世界、为人类从未解决过的全新问题找到创新解决方案的智能。如果真是这样,那就太令人兴奋了。
2025-06-11 18:58:34
1191
原创 最新!Ilya现身多大毕业演讲:AI会完成我们能做的一切
他指出,我们正生活在人类历史上最不寻常的时代 ——AI 时代,AI 最终将能够完成人类所有的工作,这将带来人类有史以来最大的挑战,但也蕴含着最大的机遇,因此我们每个人都需要积极观察 AI 的发展,培养对其能力的直觉,并为即将到来的深刻变革做好准备。但总的来说,通过观察 AI 的能力,在关键时刻不忽视它的发展,这将产生我们克服 AI 带来的巨大挑战所需的动力。我感觉到,尤其是我认为它对我们未来的影响是巨大的。当我还是这里的学生时,多伦多大学正在做世界上最好的 AI 研究,有最革命性的想法,最令人兴奋的工作。
2025-06-10 12:05:29
403
原创 为什么说Agent是一场持久战?Kimi技术大牛的深入分析
2025年被认为是"The Year of Agent",是大模型从Chatbot转向可执行动作的Agent的一年。我们也确实在去年年底到现在看到了很多Agent相关的产品或协议出现:MCP/A2AManusGenSpark...这让我们看到了AGI到来的曙光。一旦Agent能替代80%的人类白领工作,那么AGI也就可以认为得到了实现。作为技术乐观主义者,我曾对此充满信心,并认为这是在1-2年内可实现的目标。这样的信心来自于过去一年我们看到的大模型在很多benchmark上快速饱和。
2025-06-10 12:04:40
1045
原创 全球首个全栈开源通用AI Agent,从需求规划到结果交付一站式搞定!
Lemon 是一款开源的General AI Agent通用智能体,能够从需求计划到成果交付全流程自动化,它通过独立思考和系统规划,在虚拟环境中灵活调用各类工具,如编写并执行代码、智能浏览网页、操作网页应用、命令执行等。Lemon 擅长将复杂任务系统化分解并有序执行,自动分析任务、安排步骤优先级、动态调整计划,并实时跟踪进度。旨在助力用户高效完成各类任务。
2025-06-09 15:29:06
616
原创 苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃
来源 | 量子位苹果最新大模型论文,在AI圈炸开了锅。有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。再遇到真正高复杂度的任务时所有模型都会崩溃,即使给他们足够的时间和计算资源也无济于事。作者中包括谷歌大脑创始人之一Samy Bengio(图灵奖得主Yoshua Bengio的弟弟)。
2025-06-09 15:28:29
975
原创 美国将允许出口 GPU:但需由美国 IDC/云服务商运营
这项规定是在拜登政府任期末期仓促通过的。2025 年 6 月 4 日,美国商务部部长。确保新的管制措施不会阻碍美国向盟友出口。表示,美国商务部正在起草一项替代。,波兰总理找到我,质问我。后来告诉《出口合规日报》说得更具体,但很快就会。表示,上个月被撤销的。做了什么,你们竟然把。商务部将很快发布新的。
2025-06-09 15:27:57
257
原创 RLHF已死,RLVR引爆AGI革命!Claude 4核心成员万字对谈
来源 | 新智元在Dwarkesh Patel主持的节目中,Anthropic的Sholto Douglas、Trenton Bricken等人,一起讨论了Claude 4是如何思考的。三人私交甚好,聊了2小时20多分钟,主要集中在4个话题:1. 过去一年中人工智能研究的变化;2. 新的强化学习(RL)体系以及其可扩展性;3. 如何追踪模型的思考过程;4. 各国、劳动者和学生应如何为通用人工智能(AGI)做准备。对于Sholto Douglas的「AI取代人类白领工作」观点,网友纷纷表现出了极大的兴趣。强化
2025-06-08 20:27:14
710
原创 Google研究发现:Multi-Agent的核心竟然是Prompt设计!
在数学问题上,Gemini 1.5 Pro 对比仅使用自我一致性(SC)、自我细化(reflect)和多智能体辩论(debate)进行扩展的智能体,展示了每个问题的提示优化智能体的准确率与总标记数的关系。提出的多智能体系统搜索(Mass)框架通过在可定制的多智能体设计空间中交错进行提示优化和拓扑优化,发现了有效的多智能体系统设计(右侧为经过优化的拓扑结构和优化的提示),关键组件如左侧所示。:Mass在优化过程中表现出稳定且有效的性能提升,与现有自动设计方法相比,具有更高的样本效率和成本效益。
2025-06-08 20:26:35
244
原创 张祥雨访谈精华版:多模态大模型研究的挣扎史和未来
2012 年出了 AlexNet,当时正值大数据集出现(ImageNet)、算力大幅提升(Nvidia)的时期,AlexNet 把当时的神经网络扩大了两个数量级,取得了巨大成功延续做大神经网络的思路,在 12-16 年读博期间,宽度放大:做了 MSRA Init,比较好解决了模型不好开始训起来的问题;深度放大:做了 ResNet(听说当时他们显存最大装下 ResNet 152层),甚至后续用一些技术可以加到上千层模型大了以后,瓶颈重新变成算力和数据。17 年以后祥雨在旷视继续做小模型。
2025-06-07 09:21:30
907
原创 新版Gemini 2.5所有榜一,谷歌无敌了!一个月全面击败o3,编程反超Claude 4
仅一个月的时间,Gemini 2.5 Pro(06-05)直接干趴了I/O大会放出的Gemini 2.5 Pro(05-06)。新版Gemini 2.5 Pro(06-05)和旧版Gemini 2.5 Pro(05-06),名字后面版本的时间,值得玩味。相较于上一代,Gemini 2.5 Pro整体Elo提升了24分,尤其是在Web Arena上Elo提升了足足35分。而且,Gemini 2.5 Pro(06-05)还引入了「思考预算」,最高达32k,还改进了函数调用等功能。
2025-06-07 09:20:49
455
原创 Cursor 1.0首个大版本来袭!自动捉bug,秒改屎山代码,AI编程分水岭已至
如果你是一名MCP开发者,只需在文档和README中加入「Add to Cursor」按钮,就能轻松让其他开发者使用你的服务器。Cursor现在能在对话中直接渲染可视化内容,比如Mermaid图表和Markdown表格,生成后直接可见,超方便!现在,你可以一键在Cursor中设置MCP服务器,结合OAuth支持,轻松完成支持该协议的服务器认证。记忆功能让Cursor能记住对话中的关键信息,未来可随时引用。)按钮后,可以直接跳转到Cursor编辑器,就会看到填充好的修复建议,进而快速解决问题。
2025-06-06 14:54:56
290
原创 好的 founder 都懂的道理:taste 才是 AI 创业最大的壁垒
最优秀的销售代表明白,每一次与潜在客户的互动,都在教他们如何理解你的产品。出色的演示能让你的产品限制显得合情合理,让你的观点显得不言而喻。Datadog 的创始人 Olivier Pomel 对客户有着极强的同理心,但他多年来一直拒绝客户提出的深度、分层权限结构,并解释说这与 Datadog 的协作理念相悖,而协作才是客户真正想要的。突然间,你不再孤单。真正没品位的是令人尴尬的社交内容,敷衍了事的邮件轰炸,2003 年风格的 PowerPoint 模版,以及那些连自家产品功能都说不清的销售代表(SDR)。
2025-06-06 14:54:15
816
原创 00后中国女孩0产品创业实现3亿估值:斯坦福数学博士的AI量化野心
来源 | 量子位斯坦福华人数学博士AI创业,0产品0用户,目标估值3亿美元。方向瞄准数学AI,要为量化和对冲基金公司提供可解决实际数学问题的模型能力。(嗯,打造了DeepSeek的幻方量化,也是用AI来做投资量化)
2025-06-05 16:52:44
648
原创 重磅开源!首个全异步强化学习训练系统来了,SOTA推理大模型RL训练提速2.77倍
由于推理模型的输出长短差异极大,在同样的批大小(batch size)下,RL 训练必须等待批次中最长的输出生成完才能继续进行训练,以及进行下一个批次的数据收集,造成极大 GPU 资源浪费。staleness 表示当采用一个批次的数据进行模型训练时,生成最旧的一条数据的模型版本和当前更新的模型版本之间的版本差(比如,一个批次中最旧的一条数据由 step 1 产生的模型输出,当前模型由 step 5 产生,则该批次 staleness=4)。带有奖励值的轨迹数据会被存入回放缓冲区,等待训练器进行训练。
2025-06-05 16:52:10
535
原创 惊人天价!台积电1.4nm晶圆成本曝光
此外,先前也传出Google的高层造访台积电的消息,可能是为了Pixel智能手机的芯片Tensor G5将采用3纳米制程的合作而到访,预计这项合作伙伴关系将持续至少达五年之久,也使得Google成为台积电的长期客户之一。指出,台积电正持续发展其最先进制程技术,但随之而来的是晶圆生产成本的显著飙升,即使是对其获利最丰厚的客户,面对如此高昂的晶圆生产成本,也可能需要再三考虑下单的可能性。根据市场消息指出,紧随2纳米之后的1.4纳米制程(A14),也被称为埃米(Angstrom)制程,其成本预计将进一步攀升。
2025-06-05 16:51:34
286
原创 经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决
与所提出的 B-SiLU 替代函数结合使用时,VGG-16 在 CIFAR-10 和 CIFAR-100 数据集上的测试准确率分别提升了 10 个百分点和 16 个百分点,而 ResNet-18 与未使用 SUGAR 的最佳模型相比,分别提升了 9 个百分点和 7 个百分点。对 VGG-16 层激活的深入分析表明,当应用 SUGAR 时,激活分布发生了明显的变化,为其在缓解消亡 ReLU 问题中的作用提供了直观证据,同时促进了更稀疏的表示。在深度学习领域中,对激活函数的探讨已成为一个独立的研究方向。
2025-06-04 17:21:12
1108
原创 Science披露:近3年,垃圾论文激增,92%来自中国
西北大学的Reese Richardson表示,其他研究人员在一些课题中也发现了类似现象,"这种免费数据源让几乎任何人都可以采用已知的研究方法,然后换上新的变量,以一种‘疯狂研究’的姿态创造出新的‘发现’。”他补充道,研究人员为了自身职业发展,往往选择发表更多的论文而不是更高质量的论文。Spick团队的报告指出,近年来基于NHANES数据库的低质论文泛滥,可能是“论文工厂”的运作、人工智能生成文本的滥用以及大型公共数据库的成熟共同促成的。,而在2021年之前的论文中,这一比例仅为8%。
2025-06-04 17:20:11
291
原创 陶哲轩痛诉很缺钱!科研经费暴跌67%十年最低,自掏腰包科研
陶哲轩的警告掷地有声。也体现在另一面——给出了此类效率的理论上限,从而设定了正确的评估基准,避免在数学上不可能的编码方案上浪费资源。当科研经费只够你证明一个想法似乎可行,却不足以让你深入挖掘、系统研究、培养团队时,那么,所谓的创新,可能就真的只能永远停留在「概念」阶段了。「事实证明,」陶哲轩解释道,「在探索这些高维版本的球体堆积问题时产生的许多数学技巧和见解,对于解决这个问题价值巨大。基础数学的探索,正是这样一种对事物本质的极致追问,它剥离掉现实的复杂表象,去触碰最底层的逻辑和结构。
2025-05-28 14:05:24
1124
原创 DeepSeek最新模型意外泄露~
如果信息属实DeepSeek-V3-0526应该很快就会发布,毕竟马上又要端午节了,犹记得五一前国内大模型厂商那一波组团发布,那么问题又来了,万众期待的DeepSeek R2还有多远?DeepSeek-V3-0526模型性能媲美 GPT-4.5 / Claude Opus 或将成为最强开源模型。来源 | PaperAgent。
2025-05-28 12:21:38
616
原创 陕西一高中生与教授父亲共同署名发表3篇SCI论文,父亲同事:学校已调查清楚,没有任何问题,他们都很努力!多方回应
陕西省西安中学国际部的官网消息显示,张某苒是该校2024届学生,曾多次获国际大赛奖项,其中包括2023年英国生物测评(BBO)全球金奖、2022年美国生物奥林匹克竞赛金奖、2022年澳大利亚化学测评(ASOC)全球二等奖等。此外,在另外两篇分别发表于2023年、2024年的英文论文当中,张某苒分别以第三作者和第一作者的身份与张某莺共同署名。近日,有网友报料称,陕西省西安中学国际部2024届学生张某苒多次以作者身份发表SCI论文,而这些论文的作者中还有她的父亲陕西理工大学教授张某莺。
2025-05-28 12:20:34
277
原创 刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿
其实,分享出这个视频的,是前谷歌DeepMind员工Stephen Roller,后来,他又跳到了Character AI,现在来到了Thinking Machines Lab。但我们对ChatGPT的愿景,是让它无论你身在何处,都能陪伴你的整个生活。而且,他还发现了一件事,就是很多人在训练出不错的模型但达到瓶颈后,通常不会尝试分支搜索,即不会把这个模型衍生出几个不同学习率的训练路径。我们希望ChatGPT成为█████████████████████████████████████████████。
2025-05-27 14:10:57
1047
原创 马斯克重磅官宣
此前,马斯克旗下社交平台X在24日早间发生大规模宕机,目前服务已基本恢复。马斯克强调,本周社交媒体平台X出现运行中断,显示亟需进行重大运营改进,平台应该有应对故障的灾备冗余,但未能起效。此外,马斯克于5月20日在卡塔尔经济论坛上还强调,未来他将减少在政治领域的支出,自己已经做得够多了。当地时间5月24日,马斯克在社交媒体X平台宣布,他已经重新回到7×24小时工作的状态,还要“睡在会议室、服务器机房或工厂里”。他表态称:“我必须全神贯注于X/xAI和特斯拉,还有下周的星舰发射,因为我们正推出关键技术。
2025-05-27 14:10:26
280
原创 全球第一AI科学家天团,首战封神!2.5个月找到治盲新药,医学圈震撼
团队介绍说,为了生成针对干性AMD的新型治疗候选药物,他们创建了一个管线,把三个智能体Crow、Falcon(文献综述智能体)和Finch(原型数据分析智能体)连接了起来。AI科学家智能体,这次直接包办了写论文所需的全过程,人类根本无需插手——它生成了假设、设计了实验、分析了数据、进行了迭代,甚至为论文制作了图表。中间的Ali,是一名临床科学家,正在公司建立药物研发管线。这应该是人类首次做到,让AI将假设生成、实验和数据分析以闭环的形式连接起来,这也标志着,智能体推动的科学发生速度,从此会大幅加快!
2025-05-26 20:41:42
536
原创 深度|Anthropic首席产品官:从Claude到MCP,最好的AI产品不是计划出来的,是从底层自发长出来的
Mike是Anthropic的首席产品官,曾参与创办Instagram,也在红杉资本的创始人之一,长期专注于产品从0到1的打造。例如,以前我们常常关注一个文档的出处,比如有没有引用、是不是原创,这些问题现在依然重要,但在AI帮助下也变得更容易追踪。我们也在观察OpenAI的一些做法,比如他们可能会对ChatGPT做专门的微调版本,虽然大家主要是通过Chat界面来用它,但背后可能跑的是不同模型。举个例子,当你让模型帮你做点事,它说“我做不到”,但实际上是你没有设计好接口,让它能够调用这些功能。
2025-05-26 20:40:53
936
原创 爆!莫迪宣布:印度首颗芯片,诞生!
未来几年,这一贸易额将突破2000亿美元,而东北地区将成为实现这一目标的坚实桥梁。他表示,投资者不仅有机会投资东北地区的工厂和基础设施,而且还有投资该地区制造业的黄金机会。总理表示,稳健的道路、良好的电力基础设施和物流网络是所有行业的支柱。这意味着,稳健的基础设施是任何发展的首要条件,是基础。印度总理纳伦德拉·莫迪周五(5月23日)宣布,印度将很快获得东北地区半导体工厂生产的第一块“印度制造”芯片。莫迪表示,政府正在东北各邦的水电或太阳能领域进行大规模投资,价值数千万卢比的项目已经分配。
2025-05-26 20:40:22
347
原创 刚刚!首个下一代大模型Claude4问世,连续编程7小时,智商震惊人类
Claude Opus 4 是 Anthropic 迄今为止最强大的模型,也是全球最强的编码模型,它在 SWE-bench(72.5%)和 Terminal-bench(43.2%)基准上均处于领先地位,在需要专注投入和数千个步骤的长时间运行任务中表现出色,并能够连续工作数小时 —— 其性能远超所有 Sonnet 模型,并显著扩展了 AI 智能体的功能。Anthropic 表示,Claude Opus 4 是一款全球领先的编码模型,它在复杂、长时间运行任务和智能体工作流中拥有持续的高性能。
2025-05-24 18:47:08
515
原创 比Gemini Diffusion更全能!首个多模态扩散大语言模型MMaDA发布,同时实现强推理与高可控性
杨灵:普林斯顿大学 Research Fellow,北京大学博士,研究方向为大语言模型、扩散模型和强化学习。田野:北京大学智能学院博士生,研究方向为扩散模型、统一模型及强化学习。沈科:字节跳动 Seed 大模型团队的 AI 研究员,研究方向为大语言模型预训练和统一学习范式。童云海:北京大学智能学院教授,研究领域涵盖多模态大模型、图像/视频的生成与编辑。
2025-05-24 18:45:44
660
原创 拒绝不必要Think:微软&北大提出第一种自适应大型混合推理模型
大型推理模型(LRMs)过度冗长的思考过程在token消耗和延迟方面带来了巨大的开销,尤其是对于简单查询来说,这种思考过程往往是不必要的。微软研究院&北大提出了大型混合推理模型(LHRMs),这是第一种能够根据用户查询的上下文信息自适应地决定是否进行思考的模型。为了实现这一目标,提出了一种包含两个阶段的训练流程:以混合微调(HFT)作为冷启动,随后通过提出的混合群体策略优化(HGPO)进行在线强化学习,以隐式地学习选择合适的思考模式。
2025-05-23 10:42:23
488
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人