2022年11月30日,openai发布chatGPT。上架页面chat.openai.com,提供用户和ChatGPT3.5的聊天功能。没成想一夜爆火,至2023年3月份用户突破10亿。这时候openai所有人都是懵逼的状态。来看看他们的心路历程:
2015年12月11日成立的openai。
2019年2月14日发布GPT-2。
2019年4月15日,击败Dota2世界冠军。
2019年7月22日,获得微软投资。
2020年6月,GPT-3发布。
2022年11月30日,GPT-3.5 面向公众开放。一切变了。他们成立的初衷是通用性AI。在生成式AI,取得阶段性成果时,获得了空前成功。还有多模态,幻觉问题等等一系列问题没有解决。全世界的关注,让他们乱了步伐。决定在原有的那个demo外,做一些布局。
推出API
让全世界的创业者参与进来,基于他们的API,创建出百花齐放的应用。在各行各业形成颠覆性创新。于是poe,chatPDF,ppword等一系列网站应声而出。客观的说,并没有创造出和openai官网本质上不同的应用。poe主要是集成了ChatGPT和claude。chatPDF主要是解析PDF。
ppword则是做了三点:
1、稳定了输出,解决了api不够稳定,会断的问题。
2、知识库支持了常见的11种文档的解析:PDF(.pdf),office(.xls|.xlsx.csv|.doc|.docx|.ppt|.pptx),印象笔记(.enex),Email(.eml),电子书(.epub),Markdown(.md),ODT(.odt),网页(.html),文本(.txt)。可以支持多个文件聚合导一起提问。同时,分享了1700万字《中国法律大全》的公开文档。
3、建立完整的prompts系统。
推出插件系统
2023年3月23日,openai推出插件系统。第三方开发者,可以制作自己的插件,上传至openai官网。包括微软制作的bing搜索联网插件。至2023年7月30日,已经有781款插件。可惜的是,也没有形成什么波澜。其中联网插件还因为安全问题下架(联网插件可以抓取很多线上付费的内容。)
推出APP
在第三方网站,没有做出非常大的贡献后。openai自己下场,做起了APP。搭建自己的渠道。
2023年5月18日,在推出IOSD端。当天霸IOS下载排行榜。
2023年7月25日,发布安卓端,3天来到排行榜第二位。本质上,大家也没有获得比官网更好的体验。
但是,建立了自己的渠道,可以直达更多的用户和场景。
推出代码解释器和自定义指令
无奈之下,openai再次下场。教大家做事。推出了官方插件:代码解释器。在云端部署了python运行环境。chatGPT写的代码,可以直接运行。返回结果。
比如,你给他一个十万条数据的excel,代码解释器就可以编写代码读取数据,并加工生成图表。这个是极其炸裂的思路。可以撬动整个云计算和软件行业。彻底的取代程序员。但是工程量巨大。目前还不够稳定和强大。复杂的业务功能实现不了。
自定义指令:在使用chatGPT前,预设好你的prompts。比如,你告诉它你们家几口人,都有什么样的饮食习惯。每天叫他出一个菜单。它就会比较好的满足你的需求。让chatGPT了解你的背景,设定一个属于自己的chatGPT。未来tonken达到百万级别时,威力就会显现。
总体来说,并不是注册了chatGPT,就领取了一个钢铁侠的贾维斯。也不能在工作场景里,独立,自动的完成工作,成为企业的数字员工。反复的输入自己的背景知识,业务逻辑,多次提问后再得出一个不太满意的结果,不是一个好的体验。
另外,Meta(fackbook)推出LlaMa2的开源商用大模型。google的bard,还有claude2支持了10万token。这些虽然都和ChatGPT 3.5有差距,但是不会太远。
而openai在核心关键上,并没有新的突破。也一再说没有chatGPT-5。最近消息,GPT-4是有多个增强版的GPT3.5专家模型组合而来。是工程上的突破,并非技术上的突破。所以,一直在应用上想办法。看得出来,openai开始焦虑了,而且焦虑越来越重了。
未来的方向有两条:
1、性能突破,推出chatGPT-5。多模态,幻觉等问题的解决。
2、token到100万级别。
这时候不管是官方,还是poe,ppword等第三方厂家,都会有真正的炸裂应用出现。也就是更好的输出和长记忆。大家期待2023年底吧!