
大模型入门
文章平均质量分 80
CODE_RabbitV
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
seq2seq
理解 transformer 中的 encoder + decoder。原创 2025-04-01 22:40:55 · 341 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】Transformer: Attention Is All You Need -- 第一弹
🌊 Transformer 模块概述 -- 简化版本【1. Tokenization】把文字变成 Token ❄️【2. Input Layer】理解每个 Token (从语义和位置上) 🔥【3. Attention】考虑 Token 上下文 -- contextuallized token embedding【4. Feed Forward】整合思考【3 & 4 Transformer Block】反复思考【5 Ouput Layer】输出概率原创 2025-03-30 15:37:15 · 305 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】Transformer: Attention Is All You Need -- 第二弹
用最简单的语言,给你讲解 transformer 的原理,包懂的!!!原创 2024-06-25 10:39:47 · 1611 阅读 · 0 评论 -
【RLHF 理论与代码实战】GenAI HW6: LLM Values Alignment (DPO)
RLHF 理论与代码实战 (附完整代码,保姆级教程,包懂的好吧!)原创 2025-03-29 18:41:50 · 840 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】LORA:大模型轻量级微调
🌊 有没有低成本的方法微调大模型?🌊 LoRA 的核心思想🌊 LoRA 的初始化和 r 的值设定🌊 LoRA 实战:LoraConfig参数详解原创 2025-03-28 22:20:49 · 793 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】大模型如何学会使用对应的工具 (第二弹)
🌊 Toolformer 要达到的效果是什么🌊 【搜索操作和搜索结果】怎么结合到大模型的生成过程和结果中去的呢🌊 Toolformer 怎么学会使用外部工具:自监督学习使用工具原创 2025-03-26 21:41:44 · 699 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】大模型如何学会使用对应的工具 (第一弹)
🌊 WebGPT 要达到的效果是什么🌊 【搜索操作和搜索结果】怎么结合到大模型的生成过程和结果中去的呢🌊 WebGPT 怎么学会使用 `网络搜索`工具原创 2025-03-26 18:35:08 · 304 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】GPT + Gradio 聊天机器人从 0 到 1
🌊 环境准备🌊 配置 API 密钥🌊 定义与 GPT 的对话函数,支持多轮对话🌊 使用 Gradio 创建界面🌊 完整代码 & 结果展示原创 2025-03-23 15:58:13 · 490 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】快速了解大型语言模型
🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力🌊 LLM 如何生成输出:简而言之就是文字接龙🌊 GPT 之前 ...:模型规模和数据规模概览🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习🌊 ChatGPT 使用:人类向 chatgpt 靠近🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)原创 2025-03-23 00:44:40 · 583 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】除了 Prompting, 大模型还能如何被应用?
5min 上手大模型的三种主流应用方式:Prompting & RAG & Fine-tune原创 2025-01-13 16:29:00 · 810 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】大模型如何运作?
1min 快速搞懂大模型基本运作机理,以及能做什么?原创 2025-01-10 16:37:48 · 807 阅读 · 0 评论