【人工智能】大语言模型（LLM）& NLP

原创已于 2025-07-06 22:29:48 修改 · 1.1k 阅读

·

35

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#LLM #NLP #大模型 #大语言模型 #AI #人工智能

于 2025-07-03 23:56:20 首次发布

大语言模型专栏收录该内容

17 篇文章

订阅专栏

大语言模型（LLM）& NLP

1.大语言模型（LLM）
2.对比 NLP

1.大语言模型（LLM）

1.1 一句话解释

大语言模型（Large Language Model，LLM）是一个 “超级文字预测器”，它通过 “阅读” 海量文本（比如整个互联网的书、文章、对话），学会像人一样生成合理的句子。

🌰 举个栗子：
你手机输入法打 “今天天气”，它自动联想 “真好” —— 这就是微型语言模型。而大语言模型（如 ChatGPT）能联想出整段话：“今天天气真好，适合去公园野餐，记得涂防晒霜哦！”

1.2 更形象的比喻

1️⃣ 像“鹦鹉学舌”

它像一只读过千万本书的鹦鹉，虽然不懂含义，但能模仿人类说话的风格。
你问：“怎么煮鸡蛋” 它能组合出合理的步骤，因为它 “见过” 无数菜谱。

2️⃣ 像“文字乐高”

它把文字拆解成碎片（如 “苹”、“果”、“好吃”），统计哪些碎片常拼在一起。
当你输入 “苹果”，它根据统计概率拼出 “好吃” 而不是 “跑步”（因为 “苹果好吃” 更常见）。

3️⃣ 像“考试猜题学霸”

如果让它续写 “床前明月光，______”，它知道大概率接 “疑是地上霜”（因为背过唐诗），而不是 “我要吃烧烤”。

1.3 为什么叫 “大” 模型

数据大：训练时 “读” 了万亿级单词（相当于人类几百万年的阅读量）。
参数大：模型内部有数千亿个 “旋钮”（参数），用来调整如何组词造句。
算力大：需要超级计算机训练，耗电量堪比一个小城市。

1.4 它能做什么

✅ 基础技能：聊天、写邮件、编故事
✅ 专业技能：Debug 代码、写法律文书、生成数学证明
✅ 隐藏技能：模仿特定作家文风（比如用鲁迅口吻写段子）

⚠️ 但它不会：

真正 “思考”（它只是在计算概率）。
保证 100% 正确（可能 “一本正经胡说八道”）。

1.5 现实中的例子

你问 ChatGPT：“用小学生能懂的话解释黑洞”
→ 它生成：“黑洞像宇宙中的超级吸尘器，连光都会被吸进去哦！”
你让 Claude 写诗：输入 “夏天、冰淇淋、蝉鸣”
→ 它输出：“烈日舔化甜筒/蝉声炸响树荫/童年黏在手心”

一句话总结：大语言模型是一个 通过统计规律模仿人类语言 的超级工具，像一台 “文字复印机”，但比复印机聪明一万倍！ 🚀

2.对比 NLP

大语言模型（LLM）本质上仍然是自然语言处理（NLP）技术的 “超级进化版”，就像智能手机和传统手机的关系一样 —— 核心功能相同，但能力天差地别。

2.1 用 “汽车进化” 比喻 NLP → LLM

	传统 NLP 技术	大语言模型（LLM）
技术特点	专用小模型（如分词器、情感分析模型）	通用巨无霸模型（如 GPT-4、DeepSeek）
训练数据	需要人工标注数据（如 “`这句话是积极的`”）	直接 “吞食” 全网原始文本（无需标注）
能力范围	单一任务（如翻译就是翻译，问答就是问答）	全能选手（同一模型能翻译、写诗、编程、数学）
工作原理	靠人工设计的规则或浅层统计	靠海量参数自学习语言规律（人类无法解释）

🌰 举个栗子：

传统 NLP：像一辆只能前进的自行车，你要换任务得换车（换模型）。
大语言模型：像变形金刚，能随时变成汽车、飞机、轮船（同一模型处理所有任务）。

2.2 为什么说 LLM 属于 NLP

目标一致：都是让机器理解/生成人类语言。
基础技术相同：都依赖词向量（Word Embedding）、注意力机制（Attention）等 NLP 核心技术。
任务重叠：LLM 依然在做 NLP 的经典任务（如文本分类、摘要生成）。

2.3 LLM 的 “革命性突破” 在哪里

🚀 量变 → 质变：

传统 NLP 模型参数最多几亿个，而 GPT-4 有 1.8万亿 个参数，规模差距带来 “涌现能力”（突然会做没教过的事）。
例如：没人教过 GPT-4 解数学题，但它通过大量文本自学了数学推理。

🔮 从 “工具” 到 “伙伴”：

传统 NLP：像计算器（输入明确指令，输出固定结果）。
LLM：像人类助手（能理解模糊需求，主动补充信息）。

2.4 总结

大语言模型是 NLP 技术的 “究极形态”，就像智能手机依然属于 “电话” 但彻底改变了通信方式。未来，LLM 可能进一步融合语音、视觉，成为真正的 “多模态AI”，但它的语言核心仍扎根于 NLP。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大数据与AI实验室 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。