年底发烧了,兄弟们,39度,啥也没检测出来,无语

借着发烧的劲儿可以说点胡话,做做2023年的大模型总结(虽然还有10几天)和2024年的大模型展望,反正今天头晕写一些deepdive的技术文章,我肯定是写不动的
2023年我认为今后我们回头看这一年,它肯定是大模型的元年了,这一年发生了太多的代表性的事件,我挑点重要的说 ,我觉得不太重要的在这就没画面了,大家可以回帖补充
1- 2022年11月30日ChatGPT推出(我就把它当2023年了)因为热度烧到我们这边基本也是2023年了,不同于前作GPT-3,ChatGPT推出后,因为它采用RLHF的对齐方式和Chat的友好交互模式,让人类真正实现了和机器的友好人机互动,在几个月之内迅速霸榜,成为当时人类有史以来最快达到一亿用户的应用

2-2023年2月微软宣布上架New bing拿LLM集成搜索去和Google竞争(失败)
3- 2023年2月25日,Meta发布了开源(它自己非说是泄露)LLM届的可以说真正的一代目Llama。
3- 2023年3月,基于Llama 的 Alpaca和Vicuna在高校实验室里诞生,人们发现微调模型是一条路,一推出之后,国内创投圈就迅速启动了大模型自主创新的浪潮
3- 2023年3月,ChatGPT发布API,

2023年被誉为大模型元年,ChatGPT引领人机交互新篇章,各巨头相继推出LLM,如微软Bing、Meta的Llama等。国内以阿里通义、清华ChatGLM为代表,Qwen模型参数规模不断突破。2024年,MOE技术将成趋势,垂直行业大模型发展受关注,法规与算力问题亟待解决。
最低0.47元/天 解锁文章
2753

被折叠的 条评论
为什么被折叠?



