- 博客(422)
- 资源 (16)
- 收藏
- 关注
原创 AI辅助编程及大模型应用开发实战电子书已集结完毕
无论是普通人感兴趣的AI辅助编程,还是程序员目前的大模型应用实战,这里都有满足你的信息。AI席卷而来,驾驭AI,用好AI,让AI助力你起飞。电子书获取,请直接发私信给我。
2025-07-04 14:22:55
217
原创 6月份最后一天,终于在月底前完成了本月的计划,更新完大模型应用开发全系列及 Deepseek相关内容
1.大模型应用实战含微调、提示工程,API集成、部署优化等,结合行业案例解析技术落地场景。2.RAG实战围绕具体案例,覆盖从商业目标分析到后期运维运营的全生命周期实践。3.Agent 应用实战以电商客服场景为例,构建可自主处理咨询、查询订单、协助退换货及推荐商品的智能电商客服多Agent系统。融入了丰富的代码片段、详细的配置示例与命令实录,确保读者能够边学边练,即学即用。通过金融、医疗、政务、教育等多个行业的真实落地案例,让读者深刻理解 DeepSeek 大模型在不同业务场景下的巨大潜力与实际应用。
2025-07-01 07:59:21
267
原创 《大模型 Agent 应用实战指南》第11章:Agent 持续监控与运维
实时监控是 Agent 系统运维的基石,它不仅覆盖传统的系统健康和 API 性能,更深入到 Agent 独特的 LLM 调用、Token 费用和用户交互等层面。通过全面监控。
2025-06-30 09:04:56
14
原创 《大模型 Agent 应用实战指南》 第9章:Agent 结果可信性验证与幻觉规避
证据链回溯是构建可信赖、可解释 Agent 系统的基石。通过系统地记录 Agent 的。
2025-06-30 09:03:25
767
原创 《大模型 Agent 应用实战指南》第8章:Agent 测试策略与评估
单元测试是对软件中最小可测试单元(如函数、方法、类)进行的独立测试,旨在验证其功能是否按预期工作。在 Agent 语境下,这些“单元”通常是 Agent 内部的各个组件。
2025-06-30 09:03:02
17
原创 《大模型 Agent 应用实战指南》第7章:多 Agent 协作与复杂流程
多 Agent 架构通过将复杂问题分解给专业的子 Agent 来处理,极大地增强了 Agent 系统的。
2025-06-30 09:02:40
102
原创 《大模型 Agent 应用实战指南》第6章:知识库构建与 RAG 增强
结构化数据是指那些以预定义格式组织的数据,它们通常存储在关系型数据库、电子表格或特定的数据结构中,具有明确的行、列、表等Schema。这种数据易于查询、排序和分析。
2025-06-27 08:41:12
1016
原创 《大模型 Agent 应用实战指南》第5章:(Tools)工具集成与管理
大模型 Agent 的强大之处,在于它不仅仅能“说”和“思考”,还能**“做”。这种“做”的能力,就是通过工具(Tools)**来实现的。工具是 Agent 与外部世界交互的接口,它把 Agent 的智能决策转化为实际行动,比如查询数据库、发送邮件、调用第三方服务等。要让 Agent 能够使用这些工具,我们首先需要对现有系统中的各种功能进行定义和封装。这就像给 Agent 准备一个工具箱,每个工具都有明确的名称、功能和使用说明。在 Agent 的语境中,一个“工具”通常是一个特定功能的封装。
2025-06-27 08:40:43
682
原创 《大模型 Agent 应用实战指南》第4章:核心 Agent 设计与提示工程
定义:思维链 (CoT) 是指在给 LLM 的提示词中,通过提供包含中间推理步骤的示例或明确要求 LLM 逐步思考的指令,来促使 LLM 生成一个逻辑清晰、环环相扣的推理过程,最终得出结论或执行行动。目的:解决 LLM 在处理复杂问题时可能出现的“跳步”或逻辑混乱问题,提升其推理的准确性和鲁棒性。它让 LLM 不仅知道“是什么”,更知道“为什么”和“如何做”。对比:传统 Prompt:直接给出问题,期望 LLM 直接给出答案。用户:“我的订单ABC123能退货吗?
2025-06-26 17:11:25
115
原创 《大模型 Agent 应用实战指南》 第3章:基础架构与技术选型
构建一个大模型 Agent 系统,离不开一系列核心技术组件的支撑。这些组件共同构成了 Agent 的“骨架”和“大脑”,使其能够理解、推理、行动。在规划初期,选择合适的基础技术栈至关重要,它将直接影响系统的性能、成本、可扩展性和开发效率。
2025-06-26 17:09:29
19
原创 RAG实战 附录常用工具与库清单,常见问题
本附录旨在为读者提供额外资源,帮助读者将理论知识转化为实际应用。我们将列出 RAG 系统开发中常用的工具与库,提供实用的案例代码仓库地址,并解答在 RAG 开发和部署过程中可能遇到的常见问题。
2025-06-26 08:29:54
25
原创 增刊第5章:模型性能优化
定义:量化是将模型的权重和/或激活值从高精度浮点数(如FP32或FP16)转换为低精度表示(如INT8或INT4)的过程。目的:减少模型大小:例如,将FP16(2字节/参数)量化为INT4(0.5字节/参数),模型大小可缩小4倍。这有助于将更大的模型加载到有限的显存中。加速推理:低精度计算(尤其是整数运算)通常比浮点运算更快,且消耗的算力资源更少。现代GPU和AI加速器普遍对INT8/INT4计算有硬件优化(如NVIDIA的Tensor Cores)。降低内存带宽需求。
2025-06-26 06:45:47
99
原创 RAG实战 第七章:RAG 的前沿与未来展望
本章将对 RAG 技术进行总结,并展望其未来的发展方向。我们将探讨 RAG 如何与其他 AI 技术融合,以及在更复杂的应用场景中如何演进。同时,本章还将重点讨论 RAG 应用中不可忽视的伦理、隐私和安全挑战,并提出相应的风险管理策略,确保 RAG 技术的健康和负责任发展。
2025-06-26 06:41:50
23
原创 《大模型 Agent 应用实战指南》第1章:Agent 范式概览与商业机遇
在理解了传统 LLM 应用范式的局限之后,我们现在可以深入探讨大模型 Agent (Large Language Model Agent)这一开创性的概念。简单来说,一个大模型 Agent 不仅仅是一个文本生成器,它被赋予了自主思考、规划、执行和反思的能力,使其能够像人类一样,将一个高层次的目标分解为可执行的步骤,并利用外部工具来完成这些步骤。你可以将 Agent 想象成一个拥有了“大脑”(LLM)和“手脚”(工具)的智能实体,它能够理解复杂的指令,并采取一系列行动来实现目标,而不仅仅是给出答案。
2025-06-25 23:09:50
32
原创 大模型应用开发实战,来优快云看这两个专栏就够了。[特殊字符]
另外近期会增加《大模型 Agent 应用实战指南》专题,专题将以一个典型的电商客服场景为例:构建一个能够自主处理用户咨询、查询订单状态、协助退换货流程、甚至能为用户推荐商品的智能电商客服 Agent 系统。这个 Agent 不仅仅是问答,它需要调用内部 API(订单系统、库存系统、商品推荐系统)、与用户多轮交互,并在必要时将复杂问题流转给人工客服。针对粉丝的RAG系列文章,也将归入专栏。
2025-06-25 22:36:17
401
原创 【预告 大模型应用开发实战专栏 升级】将增加《大模型 Agent 应用实战指南》专题赋能 Agent 开发者
我们将以一个典型的电商客服场景为例:构建一个能够自主处理用户咨询、查询订单状态、协助退换货流程、甚至能为用户推荐商品的智能电商客服 Agent 系统。这个 Agent 不仅仅是问答,它需要调用内部 API(订单系统、库存系统、商品推荐系统)、与用户多轮交互,并在必要时将复杂问题流转给人工客服。
2025-06-25 22:18:56
848
原创 增刊第4章:成本控制与效率提升
在DeepSeek大模型私有化部署中,除了追求极致的性能,和同样是企业关注的重点。本章将探讨一系列策略,帮助您在满足业务需求的同时,有效降低硬件投入和运营开销。在实际场景中,尤其是对于中小型DeepSeek模型或低负载应用,单一GPU的算力可能无法完全被一个模型实例利用。通过实现GPU资源共享,可以显著提升硬件利用率。
2025-06-25 21:16:06
515
原创 RAG实战 第六章:RAG 系统部署、监控与持续优化
将 RAG 应用从开发环境迁移到生产环境,并确保其长期稳定、高效、可靠地运行,是构建成功智能客服助手的最后也是最重要的一步。本章将引导读者完成 RAG 系统的部署,并详细讲解如何对其进行有效的监控、日志管理以及基于性能反馈进行持续优化的策略。
2025-06-25 08:02:49
355
原创 RAG实战 第五章:RAG 中的 LLM 生成与提示工程
本章将深入探讨 RAG 系统的另一个核心支柱——。我们将学习如何利用提示工程(Prompt Engineering)这一强大技术,引导 LLM 结合检索到的上下文信息,生成高质量、准确且符合需求的答案。本章还将涵盖优化生成效果的策略,以及如何处理 LLM 可能出现的幻觉问题。
2025-06-25 08:02:00
473
原创 增刊第3章:硬件规划与资源评估
私有化部署 DeepSeek 大模型是一项涉及硬件基础设施的系统工程。在动手部署之前,进行详细的硬件规划和资源评估至关重要。这不仅能帮助企业预估成本、优化性能,还能避免资源浪费和后期扩展难题。本章将深入探讨 GPU 集群的选型策略、内存、存储与网络配置建议,并介绍如何构建成本估算模型。
2025-06-24 23:04:22
445
原创 增刊第2章:模型API封装与安全
您已经成功部署并优化了DeepSeek大模型,现在是时候将其能力暴露给上层应用了。本章将指导您如何为DeepSeek模型构建一个稳定、安全且易于使用的API接口,并探讨API安全、鉴权、限流和日志记录的关键实践。RESTful API是目前最流行、最易于理解和使用的API设计风格。我们将围绕DeepSeek大模型的核心功能——文本生成和对话,来设计API接口。
2025-06-24 23:03:35
515
原创 RAG实战 第四章:RAG 检索增强技术与优化
本章将深入探讨 RAG 系统的核心——。我们将从最基础的相似度搜索开始,逐步讲解如何通过各种高级检索策略和优化技巧,确保 RAG 系统能够从海量知识库中精准、高效地找到最相关的上下文信息,从而显著提升生成答案的准确性和质量。
2025-06-24 23:01:48
650
原创 RAG实战 第三章:知识库构建与管理
本章将详细阐述 RAG 系统中最核心的“知识”部分——。我们将深入探讨从多样化的企业数据源中提取信息,经过清洗、切分、嵌入等处理,最终高效地存储于向量数据库,并实现后续更新与维护的全流程。高质量的知识库是 RAG 系统准确性和可靠性的基石。
2025-06-24 23:01:08
458
原创 RAG 应用实战指南:从商业目标到系统落地与运营 E2E 实践
在当今信息爆炸的时代,如何高效地从海量数据中提取有用信息并提供智能问答服务,成为众多企业关注的焦点。检索增强生成(Retrieval-Augmented Generation, RAG)技术以其结合了检索模型的精准性和生成模型的灵活性,为解决这一难题提供了强大的解决方案。本实战指南将围绕一个具体的案例,详细阐述 RAG 应用从商业目标分析、技术选型、系统设计、开发实现、测试部署,直至后期运维和运营的全生命周期实践。
2025-06-24 10:46:59
832
原创 RAG 实战 第二章:技术选型与架构设计
检索增强生成(RAG)系统之所以强大,在于它巧妙地结合了信息检索的精准性与大型语言模型(LLM)的生成能力。检索模块生成模块以及将两者有机结合并优化的编排与优化模块。
2025-06-24 10:45:01
600
原创 RAG实战 第一章:商业目标与需求分析
本章将深入探讨检索增强生成(RAG)应用的,并针对进行详细的需求分析。我们将从宏观视角审视 RAG 如何解决传统问答系统的痛点,延伸至其在各行各业的广阔应用前景,最后聚焦于我们实战案例的具体需求,并确立衡量成功的关键指标。
2025-06-24 10:44:20
260
原创 第18章:附录
本附录旨在为读者提供一份DeepSeek大模型私有化部署的速查指南和延伸学习资源。我们将导读DeepSeek的官方文档,整理部署与应用过程中常用到的开源工具清单,并提供一个核心术语表和相关资源链接,帮助读者巩固知识,并进一步探索。
2025-06-24 06:55:33
26
原创 第17章:未来趋势
DeepSeek 大模型私有化部署不仅仅是当前的技术实践,它更是企业在 AI 时代保持竞争力的战略布局。随着人工智能技术的飞速发展,大模型的能力边界将不断拓宽,并与更前沿的技术深度融合。本章将探讨 DeepSeek 私有化部署在未来可能的发展方向,包括多模态能力的扩展、Agent 与企业自动化的结合,以及联邦学习与隐私计算的融合,预见这些趋势如何赋能企业,开启更广阔的应用前景。
2025-06-24 06:53:49
14
原创 第16章:常见问题与排错指南
在 DeepSeek 大模型私有化部署的复杂过程中,遇到各种问题是不可避免的。本章旨在提供一份全面的常见问题与排错指南,帮助您快速定位并解决部署、性能和模型效果方面的挑战,确保 DeepSeek 服务稳定高效运行。
2025-06-24 06:52:42
32
原创 第14章:开发企业级智能应用
将 DeepSeek 大模型私有化部署并完成微调、RAG 等准备工作后,最终目标是将这些强大的 AI 能力集成到企业的实际业务流程中,开发出真正有价值的智能应用。本章将探讨如何基于 DeepSeek 大模型构建企业级智能应用,包括智能客服系统、合同审核/报告生成助手,以及利用低代码平台进行 LLM 编排。
2025-06-24 06:49:52
121
原创 第13章:模型微调(Fine-tuning)
DeepSeek 等大模型在通用领域表现出色,但要使其在特定行业(如金融、法律、医疗)或企业内部场景中发挥最佳效能,往往需要进行模型微调(Fine-tuning)。微调是基于预训练模型,利用特定任务或领域的数据进行进一步训练的过程,旨在使模型更好地理解和生成特定领域的语言模式。本章将深入探讨领域适配的微调策略、低成本微调技术(如 LoRA/QLoRA),以及微调后模型的评估与部署。将 DeepSeek 模型适配到特定领域,能够显著提升其在该领域的专业性和准确性,减少“幻觉”,并更好地遵循领域特定的规范和术语
2025-06-24 06:49:15
15
原创 第12章:RAG(检索增强生成)实战
向量数据库是专门用于存储、管理和查询高维向量数据的数据库。它通常使用近似最近邻(Approximate Nearest Neighbor, ANN)算法来快速查找与查询向量最相似的向量。
2025-06-24 06:48:42
18
原创 第11章:API 对接与应用集成
将 DeepSeek 大模型私有化部署并投入使用,关键在于如何让业务应用能够高效、便捷地与之交互。本章将详细介绍 DeepSeek 模型服务的 API 对接方式,包括实现 OpenAI 兼容接口、利用 LangChain/LlamaIndex 等框架进行集成,以及处理流式响应和实现 Function Calling 等高级功能。
2025-06-24 06:47:54
22
原创 DeepLegal AI:智能法律文档审查与合规助手+MVP
更多大模型应用开发的知识,欢迎访问专栏DeepSeek大模型私有化落地指南和大模型应用开发实战。专栏会持续分享干货,目前正处于专栏活动期间,早学习早收获。一顿饭钱就能节省很多自己摸索的时间,千万不要犹豫!
2025-06-23 23:00:57
629
原创 增刊第1章:DeepSeek 的数据蒸馏与模型蒸馏
在 DeepSeek 大模型私有化部署的语境下,**数据蒸馏(Data Distillation)模型蒸馏(Model Distillation)**是两种重要的优化技术,旨在提高模型的效率、降低部署成本,同时尽可能保持甚至提升模型在特定任务上的性能。它们对于将 DeepSeek 模型的强大能力转化为更轻量级、更易于部署和运行的解决方案至关重要。
2025-06-23 09:40:59
502
LLM大模型实战(RAG,Agent,MCP)
2025-07-05
Excel【办公软件应用】Excel 2016快速入门指南:基础功能介绍与高效办公技巧汇总了文档的主要内容
2025-07-05
大模型实战系列-08 开发一个基于 MCP 协议的多 Agent 协作系统
2025-07-03
鸿蒙分析报告,大模型 也许成为鸿蒙跨越应用“鸿沟”的契机
2025-04-12
这份报告对 YC 2023 年和 2024 年队列中的 417 家人工智能公司进行了广泛的分析
2024-08-17
世界各地很多服务提供商采纳了TM论坛的TOM2.1业务架构模式,TOM已经成为服务提供商运营管理的工业标准。但是。。。。
2022-02-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人