大模型之二十一-小语言模型（SLM）赛道开启

shichaog

已于 2024-02-20 23:04:37 修改

阅读量1.9k

点赞数 19

分类专栏：神经网络&人工智能文章标签：语言模型人工智能自然语言处理

于 2023-12-21 18:00:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/shichaog/article/details/135135713

版权

神经网络&人工智能专栏收录该内容

31 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

当前提到大语言模型，大家想到的都是动辄百亿规模以上参数量的模型，13B、70B都是稀疏平常入门级的，但是目前从模型层面来看，模型参数量的规模两极分化已经来临，早期各大公司为了效果怼上去，采取了简单粗暴的方法，那就是训练数据越多越好，模型越大越好，事实也确实证明这么发展的路子是对的，撇开医疗、法律等行业应用，但就模型层面多模态的趋势已经非常明显，这属于巨头企业、政府的菜，绝大部分公司还是围绕开源的10B左右做行业应用。模型规模层面接下来的另一个趋势是“小”，往“小”参数了的方向发展。
这一方向的践行者是微软和谷歌，从Phi-1开始，到这个月在Huggingface上发布的Phi-2，都显示着微软在这一方面的信心，从目前的结果来看，国内会有一批公司跟风，尤其是硬件公司也会跟风，就好比15年左右智能音箱刚出来的时候一样，一批硬件公司会涌入这里，包括手机、手表、pc等移动设备。

小语言模型赛道已经开启

Google于12月初发布了Gemini模型，相比我8月份的博客《大语言模型之五谷歌Gemini》，谷歌不仅仅是给了对标OPenAI的大模型，还给了Gemini Nano小模型，该模型参数

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shichaog 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。