AI潮汐日报1203期:微信公众号后台上线“AI配图”功能、ChatGPT两周年、ICLR 2025出现满分论文IC-Light

AI 潮汐日报,旨在提供最新潮、最核心、最有意思的AI速递。四大专栏:今日热点、应用速递、研究进展、思维碰撞。

今日热点

微信公众号后台上线“AI配图”功能

微信公众号后台近日新增了“AI配图”功能,允许创作者通过输入文字描述快速生成配图。该功能提供了四张由AI生成的候选图片,用户可以调整风格和比例,并对图片进行优化,直至满意后插入文章中。文章封面同样支持AI配图。这一更新旨在简化配图流程,提高内容生产效率,同时避免图片版权问题,增强内容安全性。

ChatGPT迎来两岁生日,OpenAI计划扩展至10亿用户

ChatGPT庆祝两周年纪念日,OpenAI计划在2025年推出AI智能体产品,目标在未来扩展至10亿用户群体。目前,ChatGPT每周活跃用户已达2.5亿。OpenAI在完成新一轮60亿美元融资后,估值达到1500亿美元,并计划继续融资以支持每年高达50亿美元的支出,主要用于训练新模型和建设基础设施。同时,马斯克提交诉讼,试图阻止OpenAI全面盈利,指控其存在非法竞争行为。

翁荔万字长文探讨RLHF漏洞

前OpenAI安全团队负责人翁荔发表万字长文,深入探讨了强化学习中奖励黑客(Reward Hacking)问题,即AI代理利用奖励函数漏洞获取高奖励而未真正学习预期行为的现象。她指出,这一问题成为现实世界部署自主AI模型的主要障碍,并强调了在大模型RLHF训练中潜在的影响。翁荔呼吁更多研究关注理解和缓解这一问题,并提出了改进强化学习算法、检测奖励黑客行为和分析RLHF数据等潜在缓解措施。

ICLR 2025出现满分论文IC-Light

在ICLR 2025会议上,张吕敏团队的新作IC-Light论文获得了罕见的四个10分评价。该论文介绍了一个基于扩散模型的照明编辑工具,能够通过文本指令精准控制图像的光照效果,无需复杂的图像编辑操作。IC-Light在Github上开源,已获得5.8k星标。该技术通过合成数据和人工处理提高了光照编辑的准确性,同时保留了图像细节,对AI绘画领域具有重要意义。论文的实验结果和消融实验进一步验证了IC-Light方法的有效性,展示了其在多种光照条件下的鲁棒性和多功能性。

应用速递

阿里云推出图像编辑模型ACE,一句话修改图片

阿里云通义万相团队发布了全新的图像编辑模型ACE,用户只需输入口语化指令,即可生成和编辑图片。该模型支持可控视觉编辑、元素编辑、区域重绘编辑和分层编辑等任务,能够实现PS功能,如一键除水印、修改证件照背景等。ACE模型已面向全球开发者开源,其局部风格化功能已上线通义App。团队提出的Long-context Condition Unit模块(LCU)支持多模态条件输入,实现精准、高质量的图像指令编辑效果。

研究进展

全球AI巨头GPU算力预测

根据LessWrong网站的博客文章,全球五大科技公司的GPU算力正在迅速增长。预计到2025年,这些公司的等效H100 GPU总量将超过1240万块。其中,谷歌和微软分别以350万-420万块和250万-310万块的预测值位列前两位,xAI以55万-100万块的预测值迅速崛起。这些预测反映了AI巨头们在数据中心和下一代先进模型训练方面的激烈竞争态势。英伟达作为数据中心GPU的主要生产商,预计2025年销量将达到650万至700万块GPU,主要为Hopper和Blackwell系列,显示了其在GPU市场的领导地位。

研究发现LLM在数学推理中展现程序性知识

UCL和Cohere等机构的研究人员发现,大型语言模型(LLM)在执行数学推理任务时,依赖于一种“程序性知识”,而非简单检索答案。这项研究显示,LLM通过综合文档中的程序性知识来泛化推理任务的解决方案,表明其具备某种推理能力。研究还发现,LLM在推理问题上对单个文档的依赖程度较低,且依赖的文档集合更为广泛,这表明模型倾向于从更广泛的文档集合中泛化。

思维碰撞

Geoffrey Hinton预测AI未来十年将引发智力解放

被誉为“AI教父”的Geoffrey Hinton在接受采访时表示,人类正在经历一场比工业革命更伟大的智力解放,AI的发展将消除人类智力限制。他强调,AI的进步依赖于强大的计算能力、大量数据和技术创新。Hinton预测,未来十年的AI技术将超出当前最狂野的想象,人工智能将在医疗、教育等行业产生巨大影响,并可能取代许多工作。同时,他警告说,我们需要关注AI安全研究,并确保人类在AI浪潮中的主导地位。

Andrej Karpathy质疑大模型的“智能”成分

AI领域学者Andrej Karpathy,即OpenAI创始成员及特斯拉前AI高级总监,近日发表观点,认为人们对向AI询问事情的期待过于夸张。他指出,AI主要通过模仿人工标注数据进行训练,应视为“询问互联网上的平均数据标注者”,而非神秘化的“询问人工智能”。Karpathy强调,即使采用RLHF(基于人类反馈的强化学习)技术,模型性能提升也仅是从“人工生成”到“人工判别”级别,且群体智慧效应使LLM性能达到人类整体水平,而非个体专家水平。他质疑RLHF的强化学习意义,并提出基于规则的奖励(RBR)可能为大模型性能突破提供新思路。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值