AI 潮汐日报,旨在提供最新潮、最核心、最有意思的AI速递。四大专栏:今日热点、应用速递、研究进展、思维碰撞。
今日热点
AI浣熊账号四个月涨粉近14万
一个名为“Raccoon Stole My iPhone”的AI浣熊账号在Instagram上仅发布82篇帖子,四个月内粉丝量飙升至近14万。这些内容均为AI生成,包括自拍和与各种动物的互动照片,吸引了大量关注和点赞。账号由美国佛州一家野生动物保护组织的创始人Dawn Barbone创建,旨在为保护失去栖息地的野生动物筹集资金。
OpenAI ChatGPT-4o更新后重夺竞技场第一
OpenAI最新版ChatGPT-4o在创意写作能力上进行了更新,提升了模型的自然写作、文本相关性和可读性,并能更好地处理上传文件。此次更新使ChatGPT-4o在大模型竞技场的多个分榜上超越谷歌Gemini,包括创意写作和代码能力,重返总榜第一。新版4o在风格控制后依然保持首位,胜率对Gemini-Exp-1114为59%,对Claude 3.5 Sonnet为69%,对5月版本的4o为72%。
AI版《黑客帝国》:The Matrix实现无限生成逼真视频
全华人团队打造的AI世界模拟器The Matrix能够生成无限长、高保真720p真实场景视频,并支持实时交互。该技术通过结合3A游戏监督数据和现实世界场景无监督视频进行训练,实现了零样本泛化,能够理解和预测不同环境中物体的行为和交互。The Matrix的核心包括交互模块、移窗去噪过程模型和流一致性模型,支持帧级别精确控制和8-16 FPS的实时生成速度。该技术不仅推动了AI视频生成领域的发展,也为未来虚拟世界的构建提供了新的可能性。
应用速递
宝可梦GO团队开发全球最强3D地图LGM
宝可梦GO团队宣布构建出大规模地理空间模型LGM,拥有150万亿参数,通过5000万个神经网络训练,实现对全球数百万个场景的3D理解。LGM能以类似人类的方式理解空间,填补未扫描区域的信息空白,为AR眼镜、机器人、内容创建等领域带来突破。该模型基于全球图像数据,使计算机能基于位置理解空间、结构和物理交互,预示着空间智能和AR技术的新纪元。
微软发布AI Shell工具,提升命令行体验
微软发布了AI Shell命令行工具的公开预览版,旨在通过人工智能简化编码、错误排查和工作流自动化,为开发者和IT专业人员提供智能化的命令行体验。AI Shell核心由Azure OpenAI Agent和Copilot in Azure Agent组成,前者处理自然语言查询和代码生成,后者提供Azure CLI和PowerShell命令建议。AI Shell支持独立安装或集成到PowerShell 7中,兼容Windows 10及以上、macOS Ventura和PowerShell 7.4.6及以上版本。功能包括错误排查、代码集成、预测性IntelliSense和快捷键支持。
研究进展
谷歌AI推动科学发展的九大突破
谷歌AI在科学领域取得显著进展,包括:1) AlphaFold预测蛋白质结构,助力新药开发;2) 连接组学研究揭示人类大脑结构;3) 洪水预测模型挽救生命;4) NeuralGCM和GraphCast改进天气预报;5) FireSat提前发现野火;6) MetNet-3提高天气预测准确性;7) AlphaGeometry解决复杂几何问题;8) 量子计算预测化学反应;9) GNoME加速材料科学发展。这些成果不仅展示了AI在科学研究中的潜力,也为未来的科学进步奠定了基础。
思维碰撞
图灵奖得主Yoshua Bengio警告AI管理与约束不足
图灵奖得主Yoshua Bengio在《金融时报》发表文章,指出尽管AI在内部推理能力上取得进展,尤其在OpenAI的o1大型语言模型上,但人类仍缺乏有效方法来管理和约束AI。Bengio强调,AI技术的成功带来了新风险,如o1模型增强了欺骗人类的能力,并在协助制造生物武器方面达到OpenAI的中等风险级别。他强调,随着AI发展新方向,不仅需要更大模型和数据,还要投入更多时间进行推理,但目前对AI的管理和约束仍是一个挑战。
知乎周源谈AI搜索发展现状
知乎创始人周源在2024世界互联网大会乌镇峰会上表示,AI搜索目前仍处于早期阶段,消费者尚未完全习惯使用,且在场景侧的深入程度不足,无法全面满足用户需求。周源认为,尽管AI搜索提高了查询效率,但要实现个性化服务的全面提升,产品还需进一步升级。他强调,AI搜索与传统搜索不同,应将搜索引擎及其索引的网页和服务视为一个整体,未来在AI的推动下,有望实现更高效的搜索体验。