学习，输出==》再学习再输出

主要关注AI领域的大模型企业落地，AI辅助编程教育普及等内容，致力于AI创新和应用，推动AI赋能企业数字化转型

原创 AI辅助编程及大模型应用开发实战电子书已集结完毕

无论是普通人感兴趣的AI辅助编程，还是程序员目前的大模型应用实战，这里都有满足你的信息。AI席卷而来，驾驭AI，用好AI，让AI助力你起飞。电子书获取，请直接发私信给我。

2025-07-04 14:22:55 217

原创 6月份最后一天，终于在月底前完成了本月的计划，更新完大模型应用开发全系列及 Deepseek相关内容

1.大模型应用实战含微调、提示工程，API集成、部署优化等，结合行业案例解析技术落地场景。2.RAG实战围绕具体案例，覆盖从商业目标分析到后期运维运营的全生命周期实践。3.Agent 应用实战以电商客服场景为例，构建可自主处理咨询、查询订单、协助退换货及推荐商品的智能电商客服多Agent系统。融入了丰富的代码片段、详细的配置示例与命令实录，确保读者能够边学边练，即学即用。通过金融、医疗、政务、教育等多个行业的真实落地案例，让读者深刻理解 DeepSeek 大模型在不同业务场景下的巨大潜力与实际应用。

2025-07-01 07:59:21 267

原创《大模型 Agent 应用实战指南》第13章：Agent 的未来趋势与伦理考量

Agent 的未来将走向。

2025-06-30 09:05:38 273 5

原创《大模型 Agent 应用实战指南》第12章：Agent 运营与持续优化

数据闭环与反馈是 Agent 持续优化的生命线。通过。

2025-06-30 09:05:16 19

原创《大模型 Agent 应用实战指南》第11章：Agent 持续监控与运维

实时监控是 Agent 系统运维的基石，它不仅覆盖传统的系统健康和 API 性能，更深入到 Agent 独特的 LLM 调用、Token 费用和用户交互等层面。通过全面监控。

2025-06-30 09:04:56 14

原创《大模型 Agent 应用实战指南》第10章：Agent 应用部署与扩容

Agent 应用的部署是其走向生产的关键。

2025-06-30 09:03:53 27

原创《大模型 Agent 应用实战指南》第9章：Agent 结果可信性验证与幻觉规避

证据链回溯是构建可信赖、可解释 Agent 系统的基石。通过系统地记录 Agent 的。

2025-06-30 09:03:25 767

原创《大模型 Agent 应用实战指南》第8章：Agent 测试策略与评估

单元测试是对软件中最小可测试单元（如函数、方法、类）进行的独立测试，旨在验证其功能是否按预期工作。在 Agent 语境下，这些“单元”通常是 Agent 内部的各个组件。

2025-06-30 09:03:02 17

原创《大模型 Agent 应用实战指南》第7章：多 Agent 协作与复杂流程

多 Agent 架构通过将复杂问题分解给专业的子 Agent 来处理，极大地增强了 Agent 系统的。

2025-06-30 09:02:40 102

原创《大模型 Agent 应用实战指南》第6章：知识库构建与 RAG 增强

结构化数据是指那些以预定义格式组织的数据，它们通常存储在关系型数据库、电子表格或特定的数据结构中，具有明确的行、列、表等Schema。这种数据易于查询、排序和分析。

2025-06-27 08:41:12 1016

原创《大模型 Agent 应用实战指南》第5章：（Tools）工具集成与管理

大模型 Agent 的强大之处，在于它不仅仅能“说”和“思考”，还能**“做”。这种“做”的能力，就是通过工具（Tools）**来实现的。工具是 Agent 与外部世界交互的接口，它把 Agent 的智能决策转化为实际行动，比如查询数据库、发送邮件、调用第三方服务等。要让 Agent 能够使用这些工具，我们首先需要对现有系统中的各种功能进行定义和封装。这就像给 Agent 准备一个工具箱，每个工具都有明确的名称、功能和使用说明。在 Agent 的语境中，一个“工具”通常是一个特定功能的封装。

2025-06-27 08:40:43 682

原创《大模型 Agent 应用实战指南》第4章：核心 Agent 设计与提示工程

定义：思维链 (CoT) 是指在给 LLM 的提示词中，通过提供包含中间推理步骤的示例或明确要求 LLM 逐步思考的指令，来促使 LLM 生成一个逻辑清晰、环环相扣的推理过程，最终得出结论或执行行动。目的：解决 LLM 在处理复杂问题时可能出现的“跳步”或逻辑混乱问题，提升其推理的准确性和鲁棒性。它让 LLM 不仅知道“是什么”，更知道“为什么”和“如何做”。对比：传统 Prompt：直接给出问题，期望 LLM 直接给出答案。用户：“我的订单ABC123能退货吗？

2025-06-26 17:11:25 115

原创《大模型 Agent 应用实战指南》第3章：基础架构与技术选型

构建一个大模型 Agent 系统，离不开一系列核心技术组件的支撑。这些组件共同构成了 Agent 的“骨架”和“大脑”，使其能够理解、推理、行动。在规划初期，选择合适的基础技术栈至关重要，它将直接影响系统的性能、成本、可扩展性和开发效率。

2025-06-26 17:09:29 19

原创 RAG实战附录常用工具与库清单，常见问题

本附录旨在为读者提供额外资源，帮助读者将理论知识转化为实际应用。我们将列出 RAG 系统开发中常用的工具与库，提供实用的案例代码仓库地址，并解答在 RAG 开发和部署过程中可能遇到的常见问题。

2025-06-26 08:29:54 25

原创增刊第5章：模型性能优化

定义：量化是将模型的权重和/或激活值从高精度浮点数（如FP32或FP16）转换为低精度表示（如INT8或INT4）的过程。目的：减少模型大小：例如，将FP16（2字节/参数）量化为INT4（0.5字节/参数），模型大小可缩小4倍。这有助于将更大的模型加载到有限的显存中。加速推理：低精度计算（尤其是整数运算）通常比浮点运算更快，且消耗的算力资源更少。现代GPU和AI加速器普遍对INT8/INT4计算有硬件优化（如NVIDIA的Tensor Cores）。降低内存带宽需求。

2025-06-26 06:45:47 99

原创 RAG实战第七章：RAG 的前沿与未来展望

本章将对 RAG 技术进行总结，并展望其未来的发展方向。我们将探讨 RAG 如何与其他 AI 技术融合，以及在更复杂的应用场景中如何演进。同时，本章还将重点讨论 RAG 应用中不可忽视的伦理、隐私和安全挑战，并提出相应的风险管理策略，确保 RAG 技术的健康和负责任发展。

2025-06-26 06:41:50 23

原创《大模型 Agent 应用实战指南》第2章：商业目标与 Agent 能力边界定义

在规划智能客服 Agent 时，核心在于。

2025-06-25 23:11:22 57

原创《大模型 Agent 应用实战指南》第1章：Agent 范式概览与商业机遇

在理解了传统 LLM 应用范式的局限之后，我们现在可以深入探讨大模型 Agent (Large Language Model Agent)这一开创性的概念。简单来说，一个大模型 Agent 不仅仅是一个文本生成器，它被赋予了自主思考、规划、执行和反思的能力，使其能够像人类一样，将一个高层次的目标分解为可执行的步骤，并利用外部工具来完成这些步骤。你可以将 Agent 想象成一个拥有了“大脑”（LLM）和“手脚”（工具）的智能实体，它能够理解复杂的指令，并采取一系列行动来实现目标，而不仅仅是给出答案。

2025-06-25 23:09:50 32

原创大模型应用开发实战，来优快云看这两个专栏就够了。[特殊字符]

另外近期会增加《大模型 Agent 应用实战指南》专题，专题将以一个典型的电商客服场景为例：构建一个能够自主处理用户咨询、查询订单状态、协助退换货流程、甚至能为用户推荐商品的智能电商客服 Agent 系统。这个 Agent 不仅仅是问答，它需要调用内部 API（订单系统、库存系统、商品推荐系统）、与用户多轮交互，并在必要时将复杂问题流转给人工客服。针对粉丝的RAG系列文章，也将归入专栏。

2025-06-25 22:36:17 401

原创【预告大模型应用开发实战专栏升级】将增加《大模型 Agent 应用实战指南》专题赋能 Agent 开发者

我们将以一个典型的电商客服场景为例：构建一个能够自主处理用户咨询、查询订单状态、协助退换货流程、甚至能为用户推荐商品的智能电商客服 Agent 系统。这个 Agent 不仅仅是问答，它需要调用内部 API（订单系统、库存系统、商品推荐系统）、与用户多轮交互，并在必要时将复杂问题流转给人工客服。

2025-06-25 22:18:56 848

原创增刊第4章：成本控制与效率提升

在DeepSeek大模型私有化部署中，除了追求极致的性能，和同样是企业关注的重点。本章将探讨一系列策略，帮助您在满足业务需求的同时，有效降低硬件投入和运营开销。在实际场景中，尤其是对于中小型DeepSeek模型或低负载应用，单一GPU的算力可能无法完全被一个模型实例利用。通过实现GPU资源共享，可以显著提升硬件利用率。

2025-06-25 21:16:06 515

原创 RAG实战第六章：RAG 系统部署、监控与持续优化

将 RAG 应用从开发环境迁移到生产环境，并确保其长期稳定、高效、可靠地运行，是构建成功智能客服助手的最后也是最重要的一步。本章将引导读者完成 RAG 系统的部署，并详细讲解如何对其进行有效的监控、日志管理以及基于性能反馈进行持续优化的策略。

2025-06-25 08:02:49 355

原创 RAG实战第五章：RAG 中的 LLM 生成与提示工程

本章将深入探讨 RAG 系统的另一个核心支柱——。我们将学习如何利用提示工程（Prompt Engineering）这一强大技术，引导 LLM 结合检索到的上下文信息，生成高质量、准确且符合需求的答案。本章还将涵盖优化生成效果的策略，以及如何处理 LLM 可能出现的幻觉问题。

2025-06-25 08:02:00 473

原创增刊第3章：硬件规划与资源评估

私有化部署 DeepSeek 大模型是一项涉及硬件基础设施的系统工程。在动手部署之前，进行详细的硬件规划和资源评估至关重要。这不仅能帮助企业预估成本、优化性能，还能避免资源浪费和后期扩展难题。本章将深入探讨 GPU 集群的选型策略、内存、存储与网络配置建议，并介绍如何构建成本估算模型。

2025-06-24 23:04:22 445

原创增刊第2章：模型API封装与安全

您已经成功部署并优化了DeepSeek大模型，现在是时候将其能力暴露给上层应用了。本章将指导您如何为DeepSeek模型构建一个稳定、安全且易于使用的API接口，并探讨API安全、鉴权、限流和日志记录的关键实践。RESTful API是目前最流行、最易于理解和使用的API设计风格。我们将围绕DeepSeek大模型的核心功能——文本生成和对话，来设计API接口。

2025-06-24 23:03:35 515

原创 RAG实战第四章：RAG 检索增强技术与优化

本章将深入探讨 RAG 系统的核心——。我们将从最基础的相似度搜索开始，逐步讲解如何通过各种高级检索策略和优化技巧，确保 RAG 系统能够从海量知识库中精准、高效地找到最相关的上下文信息，从而显著提升生成答案的准确性和质量。

2025-06-24 23:01:48 650

原创 RAG实战第三章：知识库构建与管理

本章将详细阐述 RAG 系统中最核心的“知识”部分——。我们将深入探讨从多样化的企业数据源中提取信息，经过清洗、切分、嵌入等处理，最终高效地存储于向量数据库，并实现后续更新与维护的全流程。高质量的知识库是 RAG 系统准确性和可靠性的基石。

2025-06-24 23:01:08 458

原创 RAG 应用实战指南：从商业目标到系统落地与运营 E2E 实践

在当今信息爆炸的时代，如何高效地从海量数据中提取有用信息并提供智能问答服务，成为众多企业关注的焦点。检索增强生成（Retrieval-Augmented Generation, RAG）技术以其结合了检索模型的精准性和生成模型的灵活性，为解决这一难题提供了强大的解决方案。本实战指南将围绕一个具体的案例，详细阐述 RAG 应用从商业目标分析、技术选型、系统设计、开发实现、测试部署，直至后期运维和运营的全生命周期实践。

2025-06-24 10:46:59 832

原创 RAG 实战第二章：技术选型与架构设计

检索增强生成（RAG）系统之所以强大，在于它巧妙地结合了信息检索的精准性与大型语言模型（LLM）的生成能力。检索模块生成模块以及将两者有机结合并优化的编排与优化模块。

2025-06-24 10:45:01 600

原创 RAG实战第一章：商业目标与需求分析

本章将深入探讨检索增强生成（RAG）应用的，并针对进行详细的需求分析。我们将从宏观视角审视 RAG 如何解决传统问答系统的痛点，延伸至其在各行各业的广阔应用前景，最后聚焦于我们实战案例的具体需求，并确立衡量成功的关键指标。

2025-06-24 10:44:20 260

原创第18章：附录

本附录旨在为读者提供一份DeepSeek大模型私有化部署的速查指南和延伸学习资源。我们将导读DeepSeek的官方文档，整理部署与应用过程中常用到的开源工具清单，并提供一个核心术语表和相关资源链接，帮助读者巩固知识，并进一步探索。

2025-06-24 06:55:33 26

原创第17章：未来趋势

DeepSeek 大模型私有化部署不仅仅是当前的技术实践，它更是企业在 AI 时代保持竞争力的战略布局。随着人工智能技术的飞速发展，大模型的能力边界将不断拓宽，并与更前沿的技术深度融合。本章将探讨 DeepSeek 私有化部署在未来可能的发展方向，包括多模态能力的扩展、Agent 与企业自动化的结合，以及联邦学习与隐私计算的融合，预见这些趋势如何赋能企业，开启更广阔的应用前景。

2025-06-24 06:53:49 14

原创第16章：常见问题与排错指南

在 DeepSeek 大模型私有化部署的复杂过程中，遇到各种问题是不可避免的。本章旨在提供一份全面的常见问题与排错指南，帮助您快速定位并解决部署、性能和模型效果方面的挑战，确保 DeepSeek 服务稳定高效运行。

2025-06-24 06:52:42 32

原创第15章：行业落地案例详解

对复杂病程记录生成简洁摘要。

2025-06-24 06:51:05 20

原创第14章：开发企业级智能应用

将 DeepSeek 大模型私有化部署并完成微调、RAG 等准备工作后，最终目标是将这些强大的 AI 能力集成到企业的实际业务流程中，开发出真正有价值的智能应用。本章将探讨如何基于 DeepSeek 大模型构建企业级智能应用，包括智能客服系统、合同审核/报告生成助手，以及利用低代码平台进行 LLM 编排。

2025-06-24 06:49:52 121

原创第13章：模型微调（Fine-tuning）

DeepSeek 等大模型在通用领域表现出色，但要使其在特定行业（如金融、法律、医疗）或企业内部场景中发挥最佳效能，往往需要进行模型微调（Fine-tuning）。微调是基于预训练模型，利用特定任务或领域的数据进行进一步训练的过程，旨在使模型更好地理解和生成特定领域的语言模式。本章将深入探讨领域适配的微调策略、低成本微调技术（如 LoRA/QLoRA），以及微调后模型的评估与部署。将 DeepSeek 模型适配到特定领域，能够显著提升其在该领域的专业性和准确性，减少“幻觉”，并更好地遵循领域特定的规范和术语

2025-06-24 06:49:15 15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

LLM大模型实战（RAG，Agent,MCP）

一键快捷图片批量去除水印

一键批量图片裁剪处理！

Excel【办公软件应用】Excel 2016快速入门指南：基础功能介绍与高效办公技巧汇总了文档的主要内容

员工卡照片一键生成器～

绿色chrome 截屏插件

提示词随手记chrome插件

大模型实战系列-08 开发一个基于 MCP 协议的多 Agent 协作系统

鸿蒙分析报告，大模型 也许成为鸿蒙跨越应用“鸿沟”的契机

只需 10 个步骤，即可熟练使用 Excel - 全球极受欢迎的电子表格应用

Excel数据分析与模拟决策配套练习

Excel模拟运算实操

数据中台之数据架构参考

​ 这份报告对 YC 2023 年和 2024 年队列中的 417 家人工智能公司进行了广泛的分析

Evidently AI - 内部机器学习平台的终极清单

python numpy速成手册

nestc中文手册

智能家居浅析

世界各地很多服务提供商采纳了TM论坛的TOM2.1业务架构模式，TOM已经成为服务提供商运营管理的工业标准。但是。。。。

华为数字化运营.pdf

阿里云架构师成长之路-云上常见架构设计及优化.txt

Practical Guide to Agile Strategy Execution.pdf

空空如也

鸿蒙分析报告，大模型也许成为鸿蒙跨越应用“鸿沟”的契机

这份报告对 YC 2023 年和 2024 年队列中的 417 家人工智能公司进行了广泛的分析