昨天前有 ChatGPT 发布了 GPT-4o,我们整理了一篇发布会细节,感兴趣的可以看这篇👉:OpenAI 重磅发布,全新大模型 GPT-4o 全员免费开放,听说读写样样精通。
后面压力就给到了 Google I/O 大会。随后 Google 准备了一场近 2 小时的发布会,全程提了 121 次 AI,推出了十余种升级产品对阵 OpenAI。
但是在抢热点上从来没有输过的 OpenAI 今天也有重磅消息宣布,其联合创始人 Ilya Sutskever 官宣离职。
最近 AI 界真热闹,这么多新产品发布令人感到兴奋。那么这些新产品对 AI 的发展意味着什么?之后的大模型技术又会朝哪个方向发展?为此我们邀请到刘江老师来图灵八点半做一场深度剖析,从 GPT-4o 说开去,为你提供一个大模型产业的最新观察。
我们也一起来回顾一下昨天谷歌发布会的内容要点:
Gemini 1.5 Pro 模型:谷歌宣布了对 Gemini 模型的更新,特别是 Gemini 1.5 Pro 模型的上下文窗口扩展至 200 万 tokens,增强了代码生成、逻辑推理、规划和多轮对话能力,并新增了音频推理能力。此外,谷歌还推出了轻量级模型 Gemini 1.5 Flash,专为大规模任务优化。
Project Astra:谷歌推出了 AI 智能体 Project Astra,这是一个通用 AI 智能体,能够实现多模态理解和实时对话。在发布会上,通过视频演示了 Astra 识别物体、实时与人类进行语音互动的能力。
视频生成模型 Veo:谷歌发布了新的视频生成模型 Veo,与 Sora 颇为相似。该模型能够根据文本和图像生成超过 60 秒的高质量 1080P 视频。Veo 还能够理解电影和视觉技术,如延时拍摄的概念。
AI 搜索功能:谷歌搜索将融入 AI Overviews 功能,提供信息概览并辅助用户生活规划。谷歌搜索还结合了 Gemini 的先进功能,如多步推理、规划和多模态,以提供更丰富的搜索体验。
硬件更新:谷歌宣布了第六代 TPU 芯片 Trillium,与上一代 TPU v5e 相比,每个芯片的计算性能提升了 4.7 倍。能耗上 Trillium TPU 比 TPU v5e 的能源效率提高了 67% 以上,省电能力一流。
Android+AI:重点是介绍了 Gemini 的手机应用,可以和手机上正在展示的内容进行互动。比如阅读打开的 PDF,从你正在看的 YouTube 频道反馈问题。
此次发布会发布的其他产品,可以看下表了解:

(图源:腾讯科技)
可能大家觉得产品很多,但是创新又不多。不过你最关注哪个产品呢?
另一则重磅消息,OpenAI 久未露面的联合创始人兼首席科学家 Ilya Sutskever 在社交媒体上发布消息,宣布离职。还附带一张与 OpenAI 董事会成员,以及核心成员的合照。目前他已经有了下一个计划,但还不能透露细节。
在 OpenAI 工作近十年后,我决定离开公司。公司的发展轨迹堪称奇迹,我相信 OpenAI 在@sama,@gdb,@miramurati 以及 @merettm 的领导下,将会继续构建既安全又有益的 AGI。
能够一起工作是一种荣幸,我会非常想念每个人。长久以来,感谢你们所做的一切。我对接下来的事情感到兴奋——一个对我个人来说非常有意义的项目,我将在适当的时候分享细节。
随后,Sam Altman 也在社媒上发布了一条推文,表达对 Ilya Sutskever 的感谢,并宣布 Jakub Pachocki 将接替 Ilya Sutskever 成为 OpenAI 首席科学家。
Ilya 和 OpenAI 即将分道扬镳。这对我来说非常难过。Ilya 无疑是我们这一代最伟大的思想家之一,是我们这个领域的指路明灯,也是我们的挚友。
他的才华和远见众所周知,他的温暖和同情心鲜为人知,但同样重要。
没有他,OpenAI 就不会是现在的样子。虽然他个人想去做一些有意义的事情,但我永远感谢他在这里所做的一切,并致力于完成我们一起开始的使命。
我很高兴这么长时间以来,我能够跟如此杰出的天才一起共事,一个如此专注于为人类实现最美好未来的人。
Jakub 将成为我们新的首席科学家。Jakub 无疑是我们这一代最伟大的思想家之一。我很高兴他能在这里接过接力棒。他负责了我们许多最重要的项目,我非常有信心,他将带领我们朝着确保 AGI 惠及每个人的使命上,取得快速、安全的进展。
对于 Ilya下一步会去哪?做什么,大家也给出了不少猜测。
在这里我们也祝福大佬能够继续做自己喜欢的事情,为未来的科技世界带来更多惊喜。
最后,小伙伴不要忘记今晚的直播哟,有什么问题想提问欢迎留言,我们选 3 位伙伴获得赠书一本。动动手指预约吧!
ChatGPT
阅读推荐
ChatGPT 初识
《这就是ChatGPT》
[美] 斯蒂芬·沃尔弗拉姆|著
WOLFRAM传媒汉化小组|译
OpenAI CEO,ChatGPT 之父山姆·阿尔特曼推荐,国内首部由世界顶级 AI 学者、科学和技术领域重要的革新者、“第一个真正实用的人工智能”搜索引擎 WolframAlpha 发明人斯蒂芬·沃尔弗拉姆对 ChatGPT 最本质的原理的解释的权威之作!
《ChatGPT:人类新纪元》
马占凯 | 著
“搜狗输入法之父”、美团光年 AGI 布道师马占凯新作。本书用生动浅显的语言,用鲜活的故事,讲述 ChatGPT 前世今生、AI 发展史,获得罗永浩、梁宁、戴雨森、王建硕、王玥等大咖倾情推荐。附赠中国 AGI 全景图、ChatGPT 全景图拉页,让你对 ChatGPT 及 AGI 相关产业的发展一目了然。
大模型应用类
《大模型应用开发极简入门:基于GPT-4和ChatGPT》
[比] 奥利维耶·卡埃朗,[法] 玛丽–艾丽斯·布莱特 | 著
何文斯 | 译
大模型应用开发极简指南:了解 GPT-4 和 ChatGPT 的工作原理 2 小时上手开发,快速构建大模型应用并实践提示工程、模型微调、插件、LangChain等,送配套代码。大模型一线创业者、应用技术专家联袂推荐:宝玉、张路宇、孙志岗、邓范鑫、梁宇鹏(@一乐)、罗云、宜博。
《LangChain编程:从入门到实践》
李多多(@莫尔索)| 著
教你利用 LangChain 简化大模型应用开发,本书深入解析 LangChain 六大组件:模型输入/输出、检索、链、记忆、代理与回调,全方位掌握核心功能。从 0 到 1 构建多模态智能机器人,理论结合实践,轻松开启大模型应用之旅。随书附赠详尽示例代码,快速上手,轻松驾驭大模型技术。讲解细致入微,学习路径清晰明了,与时俱进,助你成为大模型应用开发达人。
《智能文本处理实战》
达观数据 | 著
“吴文俊人工智能奖”获奖企业——达观数据带来的一线行业案例经验。众多来自清华、北大、哈工大、同济、复旦、东北大学、中科院学者推荐!新浪微博、国泰君安等业内企业高度认可!内容覆盖银行、保险、制造、传媒、证券、安防、建工等。
《推荐系统:算法、案例与大模型》
刘强 | 著
为了解决推荐系统学习问题,这本书深入算法工程本质,手把手实操项目代码。内容源自达观数据真实行业案例,为读者呈现 B 端高频规则和策略。大模型时代下的推荐系统如何发展,推荐系统未来的发展趋势本书都有说明。
《信息检索与深度学习》
郭嘉丰,兰艳艳,程学旗|著
孙凝晖院士作序,张亚勤、翟成祥、李航联合推荐!学术大牛带你了解信息检索核心技术、大模型前沿应用挑战。以信息检索系统架构为引导,探讨了神经检索前沿技术,为读者呈现了信息检索领域过去与当前的全貌。三位专家通过其国际领先的科研成果,清晰地呈现了人工智能新时代的基于深度学习的神经信息检索科研现状。
ChatGPT 职场助力
《AI助理:用ChatGPT轻松搞定工作》
杜雨,刁盛鑫 | 著
畅销书《AIGC:智能创作时代》作者杜雨全新力作,写给所有职场人的 ChatGPT 应用书。内容聚焦职场工作效率全面提升,覆盖作图、视频生成、编程、提示词撰写、文案创作、智能体设计等多个场景的需求,用大模型的力量重塑你的工作流程。
本书还获得华尔街知名财经媒体人于超、梅花创投创始合伙人吴世春、PreAngel Fund 创始合伙人王利杰、Oracle Duke 选择奖项目 Moco 作者郑晔联合推荐。无论你是 AI 技术的新手还是有经验的用户,都能从本书中获益。
《利用ChatGPT进行数据分析》
张俊红|著
10 万册畅销书作者,根据 ChatGPT 在数据分析各个阶段的应用情况,按照数据分析师的职业发展路径展开,带你快速上手高效运用 ChatGPT 进行数据分析。
《ChatGPT高效提问:prompt技巧大揭秘》
李世明 代旋 张涛 | 著
本书以通俗易懂的语言,详细介绍了如何编写高质量的提示,引导 ChatGPT 输出优质答案,满足各种信息需求。书中包含详细解释和丰富示例,旨在帮助读者掌握利用 ChatGPT 解决各种问题的实用技能。
《ChatGPT从入门到精通》
黄豆奶爸 | 著
ChatGPT 超牛应用书,涉及 20 多个场景,涵盖高效办公+打造 IP+副业赚钱+新知学习+生活质量提升,粥左罗、肖厂长、孙圈圈、易仁永澄、芷蓝等联合推荐。本书旨在帮助读者了解 ChatGPT 和它背后的技术原理,掌握使用它的方法,并了解它的潜在应用和影响。
《零基础玩转 Stable Diffusion》
关键帧 | 著
为零基础读者量身打造的学习曲线,手把手保姆式教学,内容精彩,业内好评如潮 掌握创作的底层逻辑,提升设计行业的工作效率,一键搞定批量渲染,快速确定风格调性,不再人工试错!
本书从零开始讲述了 AI 绘画的基本知识具体讲解 Stable Diffusion 这个开源绘画引擎工具的本地部署使用和各种基本技巧。内容包括 Stable Diffusion 简介、Stable Diffusion 安装和配置、Stable Diffusion 基础功能、Stable Diffusion 高级技巧、Stable Diffusion 实战案例。
《Stable Diffusion——AIGC绘画实训教程》
孟德轩 | 著
Stable Diffusion 是当下非常受欢迎的 AI 生成绘画创作工具。本书一方面详细介绍了 AI 生成绘画的技术实现,包括文生图、图生图、图片分割等,引导读者了解 AI 生成绘画的具体实现方法和原理。另一方面,本书重点分析 AI 绘画在电商行业、插画设计、游戏行业和建筑行业等的应用,这些实例可以帮助读者更好地了解 AI 绘画的实际应用价值,并激发读者的创新和应用能力。
《零基础玩转Midjourney——打造AI绘画助手》
小甲鱼,袁春良 | 著
由 100 万粉丝青睐的大咖亲自传授经验,近 20 个真实案例,包含卡通 IP 形象、表情包、logo、壁纸、海报、故事绘本、电影分镜等领域。轻松解锁 Midjourney 中近 20 个参数和 20 个指令的精妙玩法。
编程知识储备
《 Python编程:从入门到实践 (第3版)》
[美]埃里克·马瑟斯 | 著
袁国忠 | 译
Python 入门圣经,影响全球超过 250 万读者,长居 Amazon、京东等网店编程类图书榜首,真正零基础,附赠随书代码+配套视频讲解+速查手册,自学无压力。
《Hello 算法》
靳宇栋(@krahets)
动画图解、一键运行的数据结构与算法教程,GitHub Star 63.9k !近 500 幅动画插图,近 200 段精选代码,助你快速入门数据结构与算法。
书中系统介绍了数据结构与算法基础、复杂度分析、数组与链表、栈与队列、哈希表、树、堆、图、搜索、排序、分治、回溯、动态规划和贪心算法等核心知识,通过清晰易懂的解释和丰富的代码示例,以及生动形象的全彩插图和在线动画图解,揭示算法工作原理和数据结构底层实现,教授读者如何选择和设计最优算法来解决不同类型的问题,切实提升编程技能,构建完整的数据结构与算法知识体系。
《深度学习入门:基于Python的理论与实现》
斋藤康毅 | 著
陆宇杰 | 译
深度学习“鱼书”,畅销 10 万册,相比 AI 圣经“花书”,本书更合适入门。本书深入浅出地剖析了深度学习的原理和相关技术,书中使用 Python3,尽量不依赖外部库或工具,从基本的数学知识出发,带领读者从零创建一个经典的深度学习网络,使读者在此过程中逐步理解深度学习。
《BERT基础教程》
苏达哈尔桑·拉维昌迪兰 | 著
周参 | 译
详细讲解十余种 BERT 变体的原理,本书聚焦谷歌公司开发的 BERT 自然语言处理模型,由浅入深地介绍了 BERT 的工作原理、BERT 的各种变体及其应用,书中用简单的文字清晰阐释 BERT 背后的复杂原理,让你轻松上手 NLP 领域的里程碑式模型。
《深入浅出神经网络与深度学习》
迈克尔·尼尔森 | 著
朱小虎 | 译
知名计算机科学家 Michael Nielsen 作品,哈工大研究生课程参考书,李航、马少平等多位业内专家推荐。作者以技术原理为导向,辅以贯穿全书的 MNIST 手写数字识别项目示例,介绍神经网络架构、反向传播算法、过拟合解决方案、卷积神经网络等内容,以及如何利用这些知识改进深度学习项目。