大模型入门
文章平均质量分 79
CODE_RabbitV
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Qwen Agent 入门介绍与简单使用示例
Qwen Agent 是由阿里巴巴推出的多模态大模型 Qwen 系列中的智能 Agent 框架。让开发者能够快速构建“能思考、会规划、能调用工具”的 AI 智能体!!!简单来说,Qwen Agent 让大模型变成“会干活的 AI 助手”,而不仅是一个聊天机器人。原创 2025-08-08 22:40:10 · 590 阅读 · 0 评论 -
【入门教程】GraphRAG 结构化检索增强生成 :从原理到实战
GraphRAG是一种基于知识图谱的检索增强生成方法,相比传统RAG具有显著优势。它通过将文本转化为知识图谱,利用实体和关系进行结构化检索,能够处理跨文档、多跳推理等复杂问题。GraphRAG流程分为索引和查询两阶段:先构建知识图谱并检测社区,再通过全局和局部检索生成连贯答案。这种方法特别适合需要深度推理的场景,如跨文档问答、知识管理等。虽然计算成本较高,但能提供更精准、更具逻辑性的回答。微软已开源GraphRAG实现,用户可通过准备数据、构建索引、运行查询等步骤进行实践应用。原创 2025-08-08 22:09:47 · 819 阅读 · 0 评论 -
RAFT:让语言模型更聪明地用文档答题
RAFT是一种新的语言模型训练方法,旨在提升模型基于文档回答问题的能力。它通过模拟"开卷考试"的方式,在训练时给模型提供相关文档和干扰文档,让模型学会辨别、引用和推理。RAFT的关键创新包括:1)控制黄金文档的出现比例,平衡查找和记忆能力;2)要求模型输出带有引用标记的推理链答案。实验表明,RAFT在医学问答等任务上显著优于传统方法,最高提升达74分。适度的干扰文档反而能增强模型鲁棒性。不过RAFT需要额外训练,计算成本较高,适合有特定领域需求的企业级应用。原创 2025-08-05 15:44:30 · 837 阅读 · 0 评论 -
RAG常见问题与优化方法全解析|从新手到高手的实践指南
📌 RAG系统优化指南:从数据准备到答案生成的全流程解决方案 本文系统梳理了检索增强生成(RAG)系统开发中的常见问题和优化策略。针对数据准备阶段,建议构建数据处理流水线并使用智能文档解析技术;知识检索阶段推荐查询转换和混合检索+重排序方法;答案生成阶段强调提示词优化和动态防护栏的应用。文章还分享了向量模型选择、本地部署方案等实践经验,并解答了"长上下文是否替代RAG"的疑问。通过这套方法论,开发者可构建更高效、透明、安全的问答系统,实现从基础搭建到专业优化的能力跃升。原创 2025-08-04 22:12:37 · 786 阅读 · 1 评论 -
【保姆级 - 大模型应用开发】DeepSeek + Faiss + langchain 从零搭建本地知识库 检索 | 理论 + 代码实战
RAG(检索增强生成)技术结合信息检索与文本生成,通过实时检索增强生成结果的时效性和准确性。其流程分为三大步骤:数据预处理(知识库构建、文档分块、向量化)、检索(查询处理、相关性排序)、生成(上下文组装、回答生成)。实战部署包括PDF文本提取、知识库构建和问答系统搭建,使用嵌入模型(如BGE-M3)和向量数据库实现高效检索。该技术特别适用于需要动态更新知识的场景,产品如NotebookLM已展现其应用潜力。不同嵌入模型适配多语言、轻量级或专业领域需求,开发者可通过开源工具快速实现RAG系统。原创 2025-08-04 18:18:20 · 1599 阅读 · 0 评论 -
【保姆级 - 大模型应用开发】 零基础 10 行代码实现词向量训练 | 代码实战
本文介绍了使用Python+jieba+Word2Vec实现中文词向量训练的全流程。首先安装jieba和gensim库,准备原始中文文本。通过jieba自动分词后,使用gensim的Word2Vec模型进行训练,可调整参数如vector_size、window大小等。训练完成后可计算词语相似度或查找最相似词语,最后保存模型供后续使用。文章提供了完整代码和示例输出,帮助读者快速掌握中文词向量训练的基本方法,适合想了解NLP基础实践的初学者参考。原创 2025-08-01 18:14:16 · 305 阅读 · 0 评论 -
【保姆级 - 大模型应用开发】DeepSeek R1 本地部署全攻略:Ollama + vLLM + PyTorch 多选方案
本文介绍了三种本地部署DeepSeek-R1大模型的方法:Ollama、vLLM和原生PyTorch,适合不同需求的开发者。Ollama提供最简单的一键式部署,适合新手;vLLM支持高性能推理和量化,适合中高端GPU用户;PyTorch方案则最灵活可控。文章详细说明了各方案的安装步骤、运行命令和硬件需求,并对比了它们的优缺点。建议根据实际场景选择1.5B到70B不同规模的蒸馏模型,在保证效果的同时节省资源。DeepSeek系列模型性能优异,部署简单,是本地化大模型应用的良好选择。原创 2025-07-29 17:52:38 · 622 阅读 · 0 评论 -
【保姆级 - 大模型应用开发】DeepSeek 的创新全解析 | 快速了解
模型推理精度显存优化本地部署开源许可✅ 超强✅ Ollama/VLLM 支持OpenAI o1强❌❌❌ 商用受限LLaMA3中✅✅❌ 有限制DeepSeek 正逐步改变国产大模型生态,值得持续关注与使用。原创 2025-07-29 17:38:19 · 3541 阅读 · 0 评论 -
【保姆级 - 大模型应用开发】Function Call 让 AI 调用函数 | 代码实战
Function Call 是一种让大语言模型主动调用预定义函数的技术。本文演示了如何通过API实现时间查询功能:用户提问"现在几点了?"时,模型会调用开发者预先编写的get_current_time()函数获取当前时间。文章提供了完整的Python代码示例,包括API请求构建、函数定义和结果处理流程,并展示了预期输出。这种技术扩展了模型能力,使其不仅能理解问题,还能执行具体操作。最后建议开发者尝试替换其他功能函数或添加多个函数供模型选择调用。原创 2025-07-24 23:39:56 · 403 阅读 · 0 评论 -
【保姆级 - 大模型应用开发】零基础调用大模型 API | 代码实战
随着大模型技术的火热,很多人都想在自己的项目中接入 GPT 等智能能力。但一提到 “API 调用”,不少人就头大。其实只需要 **不到 20 行代码**,你就可以让自己的程序拥有 “智能大脑”!原创 2025-07-24 17:22:31 · 494 阅读 · 0 评论 -
seq2seq
理解 transformer 中的 encoder + decoder。原创 2025-04-01 22:40:55 · 363 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】Transformer: Attention Is All You Need -- 第二弹
用最简单的语言,给你讲解 transformer 的原理,包懂的!!!原创 2024-06-25 10:39:47 · 1664 阅读 · 0 评论 -
【RLHF 理论与代码实战】GenAI HW6: LLM Values Alignment (DPO)
RLHF 理论与代码实战 (附完整代码,保姆级教程,包懂的好吧!)原创 2025-03-29 18:41:50 · 932 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】LORA:大模型轻量级微调
🌊 有没有低成本的方法微调大模型?🌊 LoRA 的核心思想🌊 LoRA 的初始化和 r 的值设定🌊 LoRA 实战:LoraConfig参数详解原创 2025-03-28 22:20:49 · 880 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】大模型如何学会使用对应的工具 (第二弹)
🌊 Toolformer 要达到的效果是什么🌊 【搜索操作和搜索结果】怎么结合到大模型的生成过程和结果中去的呢🌊 Toolformer 怎么学会使用外部工具:自监督学习使用工具原创 2025-03-26 21:41:44 · 735 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】大模型如何学会使用对应的工具 (第一弹)
🌊 WebGPT 要达到的效果是什么🌊 【搜索操作和搜索结果】怎么结合到大模型的生成过程和结果中去的呢🌊 WebGPT 怎么学会使用 `网络搜索`工具原创 2025-03-26 18:35:08 · 338 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】GPT + Gradio 聊天机器人从 0 到 1
🌊 环境准备🌊 配置 API 密钥🌊 定义与 GPT 的对话函数,支持多轮对话🌊 使用 Gradio 创建界面🌊 完整代码 & 结果展示原创 2025-03-23 15:58:13 · 633 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】快速了解大型语言模型
🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力🌊 LLM 如何生成输出:简而言之就是文字接龙🌊 GPT 之前 ...:模型规模和数据规模概览🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习🌊 ChatGPT 使用:人类向 chatgpt 靠近🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)原创 2025-03-23 00:44:40 · 624 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】除了 Prompting, 大模型还能如何被应用?
5min 上手大模型的三种主流应用方式:Prompting & RAG & Fine-tune原创 2025-01-13 16:29:00 · 878 阅读 · 0 评论 -
【极速版 -- 大模型入门到进阶】大模型如何运作?
1min 快速搞懂大模型基本运作机理,以及能做什么?原创 2025-01-10 16:37:48 · 844 阅读 · 0 评论
分享