LLM基础（四）——大模型很“笨”，也很“聪明”

最新推荐文章于 2025-05-23 09:16:47 发布

rebegin_2023

最新推荐文章于 2025-05-23 09:16:47 发布

阅读量253

点赞数 2

分类专栏：科研文章标签：语言模型 python chatgpt prompt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_56742836/article/details/143820832

版权

科研专栏收录该内容

5 篇文章

订阅专栏

前言

记得第一次用大模型是23年2月左右，那时候基本都是用Chatgpt网页版，版本应该是3.0左右？给我的感受就是确实效果很好，能够帮助我们完成很多简单重复的工作，尤其是文档任务。

到今年七月份才陆陆续续开始用别的大模型，不仅仅是简单的网页版对话，还有部署到本地的大模型，也有因为模型太大本地部署不下或者不开源而使用API来调用的大模型，尝试了各种prompt，也试了各种任务，本文就简单写写我的一些使用感想。

大模型很“笨”，也很“聪明”

【为什么说大模型很笨呢？】

因为我们需要把需求和它讲的很清楚，最好还要告诉它如何去思考，最最好还要给它一个外部数据库让他可以进行RAG，这样才能让它发挥出比较好的性能。

比如现在各种GPT教程都告诉你，prompt很重要，用GPT写文章需要告诉它：语言风格、面向群众、字数限制等等。

所以，LLM其实不是“笨”，只是“不了解我们的需求”。用过GPT的都知道，它啥都会一些，可以问它C语言，也可以让它写一首诗，还可以让它给你背元素周期表，既然这么全能，那它当然没法瞬间get到你需要使用它什么部分的功能。如果一个模型它专门用于代码生成，那你就可以省略这一句“You are an expert experienced in coding.”。

那么，如果你想要进行某个具体任务，或者某个小模型的效果会超过GPT，因为它是这个领域的“专家”。

【为什么它又是“聪明”的呢？】

因为大模型确实什么都会一些，就比如随着gpt从3到4，确实在性能方面有质的提升。

对于聪明的人，有这么一句话，“聪明的人最大的优点就是聪明，最大的缺点也是聪明”，放在GPT这里也是合适的，GPT常常会“自作聪明”，明明它并不知道，但还是强撑着回答你。比如你让他找一堆文献，它分分钟编一堆给你，不过期刊/会议的名称倒是一般编不出来。

博客等级

码龄4年

28
原创

67
点赞

70
收藏

37
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

LLM基础（二）——LLM幻觉
优快云-Ada助手: Python入门技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
前缀和算法详解（附C++代码示例）
rebegin_2023: s[0]的值是0，而不是不可访问
前缀和算法详解（附C++代码示例）
rebegin_2023: i就是从1到n呀，i-1是有可能出现0，即s[1]=s[0]+a[1]，s[0]为0，没有问题
前缀和算法详解（附C++代码示例）
2301_76631227: 这样子l可以等于0，应该特判一下吧
《线性代数》学习归纳与总结（第一部分）
优快云-Ada助手: 恭喜您撰写了第12篇博客！标题为《线性代数》学习归纳与总结（第一部分）的博文确实引人入胜。您的总结能够帮助读者更好地理解线性代数的核心概念和应用。在下一步的创作中，或许您可以考虑写一些实例或案例，通过具体的问题来展示线性代数的实际运用，这将进一步增强读者对于这门学科的兴趣和理解。期待您的下一篇博客！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

rebegin_2023 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。