大模型微调教程-优快云博客

原创 5 分钟用满血 DeepSeek R1 搭建个人 AI 知识库（含本地部署）

看到这里，相信你已经找到最适合自己的 DeepSeek 个人知识库方案了。如果你和大多数人一样，选择使用官方 API ，那就不用再为性能和本地硬件资源发愁；如果你恰好有充足的算力和技术储备，本地部署也是个不错的选择。不过，在整个过程中，我想和你分享的不仅仅是这些技术细节。而是一个中国团队能做出世界级大模型，一个需要 +86 才能注册的大模型。很庆幸，我们能作为中国 AI 技术进步的见证人。当然，暂时的领先不是终点。但 DeepSeek 给我们带来的，是“中国也可以”这份信心。

2025-02-05 16:07:16 9662 2

原创 2024年国内外最新AI大模型汇总（含ChatGPT、Claude、Kimi、文心、天工、讯飞、通义等10大主流AI大模型）

两年前，我和你谈论AI搜索时，你可能觉得我在做梦。但现在，梦想已经成真——信息搜索，知识工作者的新武器正如鲁迅先生所说：“输入的是垃圾，输出的也是垃圾。”在这个信息爆炸的时代，搜索能力成为了衡量知识工作者能力的关键。AI搜索的崛起AI搜索作为AI领域的热门赛道，正吸引着各路英雄豪杰。搜索引擎的两大类别：就像是我们的_私人助理，随时待命_，通过对话就能理解我们的需求，提供精准搜索结果。比如chatgpt、kimi、万知等。：这类搜索引擎则将AI技术融入搜索过程，让搜索结果更个性化、多样化。

2024-09-19 17:26:48 28218

原创用国产长文本大模型写小说，这个太强悍了 !

GLM-4-Long是智谱 BigModel开放平台（bigmodel.cn）推出的一款先进语言模型，适用于需要大规模文本生成的应用场景。GLM-4-Long有很多的实际应用场景：比如说，解读企业年报、学习论文文献、公司财务报表、阅读长篇小说甚至是分析总结长视频。关键是价格非常亲民，100万 tokens 只需1元，这简直是白给了，良心定价！2。

2024-09-16 18:00:00 8427

原创大模型学习宝典：收藏这五本书，告别碎片化，构建系统认知

本文强调在信息碎片化时代，学习大模型技术应选择系统性书籍而非碎片化知识。推荐五本不同类型的大模型书籍，分别适合入门、视觉学习、硬核修炼、知识构建和实战需求。作者认为，在AI领域，底层原理和系统性认知远比追逐热点更重要，通过系统学习可构建完整知识网络，这才是应对技术变化的根本。

2025-12-03 14:24:06 24

原创【收藏必备】RAG系统三大核心技术详解：重排、压缩与校正

重排技术核心类型精准度效率适用场景RRF无训练中极高快速融合、低算力场景有监督高中核心业务、追求精准度ColBERT轻量交互中高中高平衡效率与精准度的通用场景API/开源高中无部署成本、多语言场景生成式极高低复杂语义、无标注数据场景时效加权重排业务定制极高时效性敏感的业务场景（叠加使用）重排技术的选择核心是“场景适配”：轻量验证选RRF，核心场景选Cross-Encoder/ColBERT，复杂语义选RankGPT，时效敏感场景叠加时效权重。

2025-12-03 14:22:29 180

原创大模型ToT框架详解：思维树如何提升AI推理能力？建议收藏

ToT = Tree of Thoughts（思维树）这是一种让大语言模型能够探索多条推理路径的框架，通过构建思维树来系统地搜索问题空间，并自我评估选择最优解。ToT 是一种搜索增强的推理框架• 维护多个并行的推理路径（思维树）• 每个节点代表一个部分解或中间思考步骤• 系统地评估每个思维状态的价值• 支持前瞻和回溯（向前搜索，向后剪枝）• 通过搜索找到全局最优解，而非贪婪地选择局部最优。

2025-12-03 14:10:37 87

原创收藏！Java开发者转型AI大模型完整路径，附学习资源与实战项目

Java开发者向AI大模型领域转型并非简单技术栈替换，而是工程能力价值升级。Gartner预测，2026年超80%企业将用生成式AI API或模型，兼具传统开发与AI能力的开发者将成稀缺资源。建议“保Java攻AI”：深耕Java岗位，拓展AI能力。优秀AI工程师是带工程经验的复合型人才，您积累的经验和思维在AI时代有用武之地。转型有挑战，但工程思维能“一次学习，多维应用”。当下是将Java积累转化为AI竞争优势的最佳时机。

2025-12-02 14:27:40 432

原创【干货收藏】多智能体系统完全指南：AI协作的核心架构与实战应用

多智能体系统是由多个协作智能体组成的AI系统，通过任务分解和分工协作提升问题解决能力。文章介绍了监督者控制模式和去中心化协作两种主流架构，以及A2A协议这一标准化协作框架。通过奶茶订单实例展示了多智能体在实际应用中的协作流程，强调了设计好上下文(信息共享)是多智能体系统高效解决问题的关键。

2025-12-02 14:25:14 520

原创【必藏】构建99%+可用性的RAG系统：大模型落地高可用实战指南

RAG系统中，向量库、LLM、知识源等多个服务相互依赖。若向量库响应变慢，LLM服务因等待超时而堆积请求，可能引发级联失败此时需引入熔断机制当错误率或延迟超过阈值，自动“熔断”依赖调用；进入熔断状态后，直接返回fallback响应（如缓存结果或默认提示）；经过冷却期后尝试半开恢复，逐步试探服务是否可用。在Go生态中，可使用Sentinel（阿里开源）或自研基于滑动窗口的熔断器。错误率阈值：如5秒内错误率>50%则熔断；最小请求量：避免低流量时误判；熔断时长：如30秒后尝试恢复。

2025-12-02 14:23:52 554

原创【收藏】AI Agent与Agentic AI技术全解析：从技术原理到落地应用

OpenAI应用研究主管Lilian Weng提出的“Agent=大模型+规划+记忆+工具”是行业公认框架，我们用“点外卖”场景拆解：• 大模型（大脑）：理解“想吃清淡午餐，预算50元以内”的需求，判断需调用外卖平台工具；• 规划（拆解任务）：将“点外卖”拆分为“定位当前地址→筛选符合预算的轻食店→查看用户评分→推荐3款热销餐品→确认后下单”5个步骤；• 记忆（存储信息）：短期记忆记住“不吃香菜”的即时要求，长期记忆（外部向量数据库“云端笔记本”）调取上周点过的3家轻食店记录，优先推荐好评商家；

2025-12-02 14:19:51 376

原创 AI Agent从入门到实战：实现官方长期记忆，让AI真正“认识“你

本文介绍了如何为AI Agent实现官方版长期记忆，使其能够持久化存储和检索用户信息。文章首先区分了会话记忆、长期记忆和RAG的概念差异，然后详细讲解了LangChain 1.0+版本中记忆模块的变化，最后通过实战代码演示了创建读写工具、初始化记忆库、定义上下文结构等步骤，让Agent能够"认识"并记住不同用户的信息，为后续个性化服务奠定基础。

2025-12-01 17:24:25 921

原创从规则到AI原生：构建智能客服的评测与优化体系，收藏学习大模型应用实战

本文详细介绍了智能客服从基于NLP的传统规则系统到基于RAG，再到AI原生的演进历程，重点阐述了如何构建"评估-诊断-优化"三位一体的运营Agent平台，实现客服机器人服务质量的持续进化。文章分享了在实际应用中遇到的挑战及解决方案，包括LLM随机性处理、上下文工程、业务场景强依赖等问题，并通过实际案例展示了该体系在提升客服效果方面的价值，为开发者提供了大模型在客服领域落地的实践经验。

2025-12-01 17:22:59 578

原创智能体开发必看：从基础通信到RAG架构，构建高效大模型应用（建议收藏）

所谓幻觉（Hallucination），是模型在缺乏真实知识支撑时，会根据语言统计规律“合理地胡说”。这个问题几乎存在于所有的大模型中，因为模型的知识都停留在训练数据里。

2025-12-01 14:33:30 658

原创企业级AI Agent实战指南：程序员必学的数字化转型利器，值得收藏

AI Agent正成为企业数字化转型的核心基建，通过自主感知、决策与执行能力破解企业人力成本攀升、流程冗余等挑战。MCP标准为其与外部系统交互提供支持，使Agent从单一工具进化为自主决策单元。典型应用场景包括客户服务、销售营销、内部运营和研发创新。企业可通过五个阶段落地AI Agent，从办公场景试水到构建Agent中台，实现企业智能化升级。

2025-12-01 14:31:04 1015

原创 2025年程序员必看！大模型领域8大高薪岗位转型指南，建议收藏

本文介绍了程序员转型AI大模型领域的8大热门岗位及职业发展建议，详细阐述了从基础知识学习到项目实践的转行步骤。文章强调国内大模型人才稀缺，2025年存在巨大职业机会，并提供了系统学习资源。持续学习、积累实战经验、建立人际网络和寻找导师是成功转型的关键。

2025-12-01 14:20:42 690

原创多模态Transformer核心难题：不同模态序列长度差异的解决方案（必看）

多模态Transformer面临的核心挑战是不同模态（图像、文本、语音）序列长度差异巨大。主流解决方案有三种：1）统一长度：通过下采样或补齐使序列一致，但会丢失信息或浪费算力；2）跨模态对齐：各模态独立编码后通过cross-attention对齐，计算效率高，如CLIP、BLIP等；3）动态建模：根据内容相关性自适应选择代表性token，平衡算力和精度。Transformer作为通用模态接口，将一切转化为token序列，用统一注意力机制建模不同模态。这其实是一个非常典型、但又容易被忽略的问题。

2025-12-01 14:17:23 828

原创从入门到精通：RAG与GraphRAG技术对比及适用场景分析，建议收藏

文章提出了GraphRAG-Bench评测基准，对比分析了RAG与GraphRAG在知识表示、检索机制和性能上的差异。研究显示，GraphRAG在复杂推理、上下文摘要和创造性生成任务中表现优异，但在简单事实检索中不如传统RAG。GraphRAG更适合医学诊断、法律分析等需要深度理解的任务，但实现复杂度和资源消耗较高。最近的研究报告称，在许多实际任务中，GraphRAG的表现往往不如普通的RAG。因此产生一个问题：GraphRAG真的有效吗？在哪些场景下，GraphRAG有收益？

2025-11-30 13:45:00 1603

原创程序员必读：一文搞懂AI生态中的LLM、RAG、MCP、Agent概念与关系【建议收藏】

听懂掌声。没听懂也不要紧，接下来细说这些名词具体都是干嘛的。

2025-11-30 10:45:00 580

原创【干货收藏】程序员必学！手把手教你从零微调大模型，附AGI独家资料包

微调大模型需高电脑配置，如 GPU 环境，即在预训练基础上对大模型小训练。无需担心，本文用阿里魔塔社区集成环境，无需自备电脑配置环境，有浏览器即可完成。本次微调零一万物的 Yi 开源大语言模型，微调其他大模型过程和原理类似。话不多说，直接开始。

2025-11-29 15:24:45 810

原创【程序员必看】GraphRAG入门指南：构建超越传统RAG的知识图谱问答系统（建议收藏）

从传统RAG到GraphRAG，这不仅是技术的升级，更是思维方式的转变。我们不再只是被动地检索信息片段，而是主动构建知识的结构。大模型也不再只是做语言匹配，而是真正在理解和推理。虽然GraphRAG还不是完美的（毕竟也依赖于大模型的抽取质量），但方向是清楚的——让AI系统更像人类思考一样，理解信息之间的关系，看到知识的全貌。如果你的业务涉及复杂的知识库问答，值得尝试一下。而且现在有免费的云服务可以用，技术上的壁垒已经不那么高了。

2025-11-29 15:23:16 879

原创从GPT-5到盘古：2025年AI大模型排行榜，一篇看懂全球AI格局，值得收藏

本文分享了2025年全球十大AI大模型排行榜，包括OpenAI的GPT-5、Google的Gemini 2.0 Ultra、DeepSeek等，从技术性能、应用场景等维度进行了分析。文章指出中国AI大模型已占60%，形成中美双极格局，且AI发展正从单一性能转向垂直应用场景。DeepSeek、讯飞和豆包在应用层表现突出，将成为下一阶段AI发展的引领者。

2025-11-28 14:49:53 1928

原创【必收藏】AI大模型：程序员的下一个风口，薪资逆势上涨150%

AI大模型正成为程序员的职业新风口，大厂80%招聘岗位与AI相关，薪资逆势上涨150%。传统CRUD开发逐渐被AI原生应用替代，掌握RAG优化、模型微调等技能将成为求职基本门槛。AI大模型应用开发提供广阔职业空间，是程序员不容错过的转型机遇。

2025-11-28 14:42:34 917

原创【必学收藏】小白也能看懂的AI Agents与Agentic AI全解析：从入门到实战应用

论文综述系统性区分AI Agent（智能体）与Agentic AI（自主式AI系统），并通过构建结构化的概念分类体系、应用映射与挑战分析，阐明两者在设计哲学与能力上的差异。论文将AI Agent界定为由LLM（大型语言模型）和LIM（大型推理模型）驱动的模块化系统，主要用于特定任务的自动化。生成式AI（Generative AI）被视为其前身，而AI Agent则通过工具集成、提示工程（prompt engineering）和推理增强实现进一步发展。

2025-11-28 14:40:43 711

原创【必学收藏】大模型Agent交互设计指南：从三阶段旅程看设计原则与实战案例

文章讨论了大模型Agent产品的交互设计原则与挑战，提出三大基石：透明可释、认知减负、人在环路。将Agent使用过程分为任务启动、过程执行和结果交付三个阶段，分析各阶段的核心挑战及应对策略，并结合Datadog、Atlassian Rovo等10多个实际产品案例进行说明。文章强调Agent设计应以人为中心，通过透明与可控的体验建立信任，让人机协作更自然高效。

2025-11-27 18:30:23 244

原创值得收藏！AI产品经理实战全流程图：从需求洞察到持续运营

本文详细拆解了AI产品经理的工作全流程，涵盖需求定义、方案设计、协作开发、数据闭环、效果评估和持续运营六大阶段。文章指出80%的AI产品问题源于对工作全流程的认知模糊，并提供了每个阶段的关键动作和产出物。强调AI产品经理的核心竞争力不是技术知识，而是在模糊中锚定目标、在黑盒中建立可控路径、让AI真正服务于人。文章还分享了建立数据闭环防止模型"静默衰退"、采用三层评估体系衡量业务价值等实用方法，帮助AI产品经理避开高频踩坑点。

2025-11-27 18:29:24 543

原创 AI架构未来：大模型技术全解析，程序员收藏学习宝典

文章探讨了AI技术如何架构未来，分析了从单体应用到云原生再到AI时代的架构演进。作者预测未来将出现个性化政府服务、认知型企业和超级个体；技术上将发展对话式操作系统、自然语言编程和人体集成硬件。文章强调每个人应从AI"使用者"转变为"共建者"，提升"AI素养"，成为"架构师"，用智慧和责任共同构建智能温暖的未来世界。

2025-11-27 18:26:23 1033

原创【必收藏】LoRA技术详解：用0.01%参数量实现大模型高效微调

Lora为PEFT 基于重参数化（Reparametrization-based）训练方法。全称low-rank adaptation of large language models。为了使微调更加高效，LoRA的方法是通过低秩分解将权重更新表示为两个较小的矩阵（称为更新矩阵）。这些新矩阵可以在适应新数据的同时保持整体变化数量较少进行训练。原始权重矩阵保持冻结状态，并且不再接受任何进一步的调整。最终结果是通过将原始权重和适应后的权重进行组合得到。“低秩”（Low-Rank）是一个线性代数中的概念。

2025-11-27 14:34:10 418

空空如也

空空如也