什么是大模型?写给普通人的AI大模型认知科普,看完这篇你就懂了!

这篇文章不讲操作,而是一篇AI大模型的科普。
主要面向没有专业和技术背景的普通人,
目的是在日常使用AI时,能否有所明悟。
次要目的是让普通人在纷扰信息环境中,
有能力分辨真假,不被夸张的宣传迷惑。

1、大模型的本质

对于普通人而言,无需理解技术环节,比如神经网络、CNN、RNN、LSTM、transformer等名词,它们都是在用计算机模拟人脑结构,模拟人脑的功能罢了。

专家们每隔一段时间,就会升级“人造大脑”,比如增加它模拟的人脑神经连接数量。然后,把海量的知识,比如书籍、文章、网页,一股脑打包塞进“人造大脑”。
这就是所谓的“大模型预训练”,就是塞数据填鸭式教育。

而学习成果,只有一个,就是猜答案
比如你说“床前明月光”,它大概率会接“疑是地上霜”,因为这是它从无数古诗数据中学到的规律。

人类婴儿时期的学习,也是从听和看开始,记住常见词汇句子规律。大模型也一样,只不过它的单位叫“Token”,跟人类的词汇单位不完全一致。

靠“猜”的结果,无法完全避免错误,这就是所谓的“幻觉”,比如一本正经的编造历史。而且因为它是基于人类知识的规律“猜答案”,更让人觉得合理,不易发现错误。

2、提示词

大模型被填鸭式塞入了全人类知识,通过提示词可以调取它的“满腹经纶”。
简单理解,提示词就是在大模型“人造大脑”中搜寻知识的关键词
只不过,传统搜索引擎找出来的是原文,而大模型吐出来的是它按规律猜测单词的组合。

如何引导大模型“思考”,决定了答案的好坏。
网上有很多“提示词公式”,帮助普通人快速入门,但从根本上讲,写好提示词的窍门,在于两点:

写好提示词的窍门

明确目标,给足够细节”。
1)明确要什么,相当于给它思考方向
2)提供足够细节,约束它的思考边界

基于这两点,可以演化出更多的提示词技巧。
比如在《[DeepSeek普通人使用指南]》和《[DeepSeek超实用36个场景72个提示词]》中用到的一些方法:

  • 提供人设身份信息
  • 提供分步执行要求
  • 提供参考案例演示
  • ……

如果稍加总结,每个人都能获得自己的“公式”,比如:

身份人设+任务目标+限制约束+输出格式

  1. 身份人设:你是谁?(教师/医生/律师/学生/自媒体主理人……)
  2. 任务目标:要解决什么问题?(分析数据/设计方案/写文章/做报告/排计划……)
  3. 限制约束:有哪些限制条件?(操作难度/适用场景/食物过敏/通俗易懂……)
  4. 输出格式:输出内容的格式?(普通文本/Markdown/表格/Mermaid/HTML/代码……)

“公式”的好处,除了能帮助普通人快速入门,还可以把开放问题,转变为“填空题”。举个例子:

案例:设计商业模式

我是一名AI创业者,想通过Coze和微信小程序的组合,为自媒体博主提供在线服务。请设计该项目的商业模式,输出商业模式画布,以及逐步演进策略(输出表格格式)。

公式对应“填空题”

【身份人设】:AI创业者
【任务目标】:商业模式设计和演进策略
【限制约束】:组合Coze+小程序服务自媒体博主
【输出格式】:表格

对于提示词的学习建议

  • 未入门

    :想到什么问什么,不要有顾虑

  • 已入门

    :尽量言简意赅,表明目的

  • 想进阶

    :观察AI思考过程,补充细节并引导约束

当你刚接触某个新领域,或学习某个新知识时,可以试试下面的提示词,这是一个逆向提问和思考的小技巧,让AI辅助你学习。

案例-逆向提问小技巧

我想要【设计一个品牌】,但我不懂【营销】,请引导我系统化思考如何【设计品牌】,以及该如何向你提问。

3、AI搜索

大模型诞生之初,只学会了被塞入的那部分数据。
比如诞生在2023年的大模型,它无从知晓2024、2025年的信息。
但它却掌握了2023年以前的知识规律,能联想、会推理,只要我们提供最新的数据给它,照样可以完成思考任务。

最直接的方式,复制最新的新闻到提示词中一并提问。
但每次都这么操作很麻烦,而且内容一多提示词变得庞大无比。
于是,AI搜索出现了,作为触手附着在大模型上,自动完成搜索任务。

Pasted image 20250313115706.png
Pasted image 20250313115736.png

这样,我们使用时就不必复制粘贴大量额外信息供大模型参考,也能让大模型获得最新数据。

虽然依托大模型,AI搜索能直接提供答案,但相比传统搜索引擎,AI搜索的触手能力依旧比较弱。
比如,它还无法定向搜索指定的网站范围,也无法搜索私域信息

部分产品如秘塔,可以设置搜索偏好,但大部分时候也无法成功搜素微信公众号的内容。
Pasted image 20250313120412.png

相比技术局限,更多取决于内容壁垒
换句话说,哪个平台有更高质量的内容来源,未来大概率也会有更大的AI竞争优势。再通俗些,未来优质内容会越来越值钱

而对于AI搜索无法触达的内容,需要借助AI知识库解决。

4、AI知识库

AI知识库,可以简单理解为私域版的AI搜索
搜索被限制在知识库范围,且知识库的内容由用户自己掌控。
类似AI搜索,AI知识库同样也是一种附着于大模型上的触手。
它的职责是把文档切片,让大模型能读懂信息,并在需要时方便找到。

最简单的知识库,是随提示词上传文档。

Pasted image 20250313121401.png

在手机上操作时,更推荐自带小程序的产品。
如腾讯元宝,能方便从微信聊天中上传文件
毕竟,很多人都会临时用微信传送文件。

Pasted image 20250313122052.png

文档上传后,知识库会开始切片,根据提示词提取相关内容,一并发给大模型。

如果文件较多,或每次提问都要附带同样文档,那提前建一个知识库效率会更高。
比如,腾讯的ima助手:

Pasted image 20250313143629.png

在创建好知识库后,就可以基于知识库提问。
又或者用CherryStudio,勾选多个知识库一起提问。

Pasted image 20250313143758.png

现在还有更丰富的知识库产品,如百度文库的无限白板模式。
但AI知识库的本质并没有改变,仍是附着在大模型上的触手。

Pasted image 20250313144227.png

5、微调

大模型诞生于“填鸭式的塞数据”,而且塞的是通识数据,这也意味着它什么都“懂一点”。
但遇到专业问题,如金融或工业能源领域的某个具体问题,如果依旧用通识来回答,很容易就会显露不专业,看起来答非所问。

大模型使用时,我们能通过提示词、AI搜索和AI知识库,补充信息优化回答结果。
这个过程中,并没有改变大模型本身,即没有改变它诞生时的出厂设置。2023年诞生的它,依旧只知道2023年之前被填塞的数据,掌握的能力和规律也没有变化,每次使用都需要补充最新信息。

当我们希望改变大模型能力结构,比如让它更擅长于某个应用领域,或者掌握一个新的能力时,就需要对它进行二次训练,即“微调”

微调,就是给已诞生的大模型,继续塞专业数据,让它快速补充某个专业领域的知识。

对于普通人而言,目前微调有一定门槛。
门槛并非在技术层面,而是在专业数据的准备。
只有优质的数据,才能调教出好用的模型。

6、多模态

大模型在诞生之初,主要的形态是文本生成。
但随应用推广,人们的需求已不局限于文字。
比如,让AI生成图片、音乐和视频,
或者,让AI讲述图片里包含的信息,甚至故事。
就像人类用不同的感官去感受和体验世界,AI通过多种数据形式,读懂并参与到数字世界,这就是AI的多模态能力。

比如,《[突破DeepSeek实战,普通人12个神级工具推荐]》文章中推荐的即梦和豆包,就是比较容易理解的案例。

即梦同时具备了生成图像、音乐和视频的能力。
通过提示词,就能引导它模仿人类创作。

Pasted image 20250313154910.png

豆包同时具备图像视觉理解和语音对话能力。

  • 图像理解:就像为AI装了一双眼睛,让它有了视觉;
  • 语音对话:就像跟朋友打电话,能听懂你说的话。

Pasted image 20250313153405.png

多模态让AI能更紧密地融入我们的世界,让它能听能看,能说会道,还能艺术创作

7、Agent和API

Agent的英文直译为“代理”,放在AI环境可以理解为人类在数字世界的代理。
比如,我们点外卖,会用美团、大众、饿了么等软件,这些软件就是一种代理工具,让我们足不出户就能享受到餐厅的美食。
而API,简单理解,就是软件和软件之间的交流语言。就像人与人之间,会用中文、英文等语言对话一样,软件之间会用API对话

前几天Manus在AI领域成了热议话题,虽然营销成分居多,但却也为普通人掀开了AI发展的一角。
以前大部分的软件硬件,都是为人类而设计。
硬件如鼠标、键盘、显示器等交互配件;
软件如按钮、输入框、表格等交互元素。
AI时代,软硬件同样能为AI大模型而设计,为大模型配备一台电脑,让它自由操控完成任务。

AI搜索,其实也是一种Agent,帮助我们自动搜索网页内容。
可以预见,未来会有更多的Agent出现,基于大模型,完成原本需要人类操作软件达成的任务。

总结

从计算机诞生的那刻起,我们就已注定要迈入数字世界。
互联网的出现,作为一级加速器,加速了这个过程;
大模型,则是二级加速器,让数字世界更快降临。

作为普通人,我们并不需要了解大模型如何实现。
就像我们不需要知道自己的大脑内部长什么样。
我们关注的是如何在生活工作学习中发挥大脑潜能
同样对于大模型,我们关心的也只有2点:
1)它有什么能力,能做什么?
2)如何使用它,如何驾驭它?

普通人如何抓住AI大模型的风口?

=领取方式在文末==

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

大模型全套学习资料领取

这里我整理了一份AI大模型入门到进阶全套学习包,包含学习路线+实战案例+视频+书籍PDF+面试题+DeepSeek部署包和技巧,需要的小伙伴文在下方免费领取哦,真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段
在这里插入图片描述
在这里插入图片描述

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,皆可用。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

三、视频和书籍PDF合集

从入门到进阶这里都有,跟着老师学习事半功倍。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

四、LLM面试题

在这里插入图片描述
在这里插入图片描述

五、AI产品经理面试题

在这里插入图片描述

六、deepseek部署包+技巧大全

在这里插入图片描述

😝朋友们如果有需要的话,可以V扫描下方二维码联系领取~
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值