自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

luguochang的博客

原创深度解析：基于 RAG 与 LLM 的智能推荐系统架构设计

智能推荐系统架构设计：RAG与LLM的融合创新本文深入解析了一套基于检索增强生成(RAG)和大语言模型(LLM)的智能推荐系统架构。该系统分为离线数据处理和在线推理两大流程：离线部分通过文档解析、规则提取和LLM特征工程构建知识库；在线部分则根据用户交互深度动态生成画像，结合向量检索实现个性化推荐。文章详细拆解了五个核心模块的设计思路，包括数据解析层、规则提取层、LLM特征工程层等，并提供了典型生产案例和工具栈建议。特别强调了LLM在特征工程中的关键作用，以及如何处理延迟等实际挑战。该架构通过融合传统推荐

2025-11-24 14:26:06 369

原创 WVP+ZLMediaKit流媒体实战：从园区千路接入到云端级联优化的全链路解析

本文深入解析了基于GB/T 28181协议的WVP+ZLMediaKit流媒体架构方案。该方案采用信令与媒体分离的设计理念，WVP负责SIP信令管理，ZLMediaKit处理视频流转发与协议转换。相比厂商SDK方案，该架构具有跨品牌兼容性强、Web支持友好等优势。针对千路并发场景，分析了网络带宽、CPU内存等关键瓶颈，并给出TCP被动模式等优化建议。在云边级联场景中，提出了按需拉流策略以降低流量成本。文章还揭示了时间戳异常等生产环境常见问题及解决方案，为大规模视频监控系统建设提供了实用参考。

2025-11-24 14:08:45 851

原创面向海量并发的云边端协同IoT架构研究：数据流向、网关内核与分布式状态管理

随着物联网（IoT）技术的飞速发展，连接规模已从简单的数万台设备跃升至数亿级海量并发。传统的单体架构已无法满足工业互联网、智慧城市及车联网等场景对低延迟、高可靠性及离线自治的严苛要求。“云-边-端”协同架构因此成为业界事实上的标准范式。本报告旨在对该架构进行详尽的技术解构，特别聚焦于华为IoTDA（IoT Device Access）、智能边缘平台（IEF）及EMQX等业界领先解决方案的架构设计。

2025-11-23 15:20:26 834

原创深度解析：AI 联网搜索（Search-based RAG）的生产级架构实践

本文深入探讨了AI联网搜索（Search-based RAG）的生产级架构实践。针对大语言模型的知识局限性，提出了一套包含广度检索、精度筛选、深度解析和知识增强的漏斗型解决方案。通过搜索引擎API获取初始结果后，利用语义评分筛选高相关URL，再通过爬虫和数据处理转换为模型友好的Markdown格式，最终结合RAG流程实现精准回答。文章详细拆解了各阶段技术实现，包括Cross-Encoder重排序、HTML清洗和Prompt组装等关键环节，并提供了实际案例说明。

2025-11-23 14:16:47 496

原创构建企业级 RAG 知识库：从向量存储到全链路护栏

企业级RAG知识库构建指南：从向量存储到全链路安全本文深入探讨构建企业级RAG知识库的关键要素，包括：安全控制：通过权限校验和输入护栏防范恶意攻击查询优化：利用上下文理解重写用户查询提升检索精度混合检索：结合向量检索与关键词搜索提高召回率存储方案：对比专用向量库、传统数据库扩展等不同选择输出防护：设置护栏拦截不当回答并建立用户反馈闭环文章通过多个行业案例和方案对比，为企业构建高可用知识库系统提供实用参考。

2025-11-22 10:45:41 810

原创企业级大模型推理网关设计：混合部署与高可靠通信机制详解

本文详细介绍了企业级大模型推理网关的设计方案，重点解决多模型混合部署和高可靠通信问题。系统采用Controller-Worker主从架构，支持在线商业模型和离线开源模型混合部署，通过敏感路由、降本路由和能力路由策略实现智能调度。核心创新在于异步回调存储机制，由Worker直接完成数据持久化，确保即使在网络中断情况下也能保证数据一致性。同时，通过协议清洗实现统一流式响应接口，简化前端开发。该架构有效平衡了企业级应用在成本、安全和稳定性方面的需求，为商业级RAG系统提供了可靠基础。

2025-11-22 10:44:35 1161

原创高性能 RAG 架构实战：从数据工程到 Agent 的全链路落地与工具选型

V1 版本：解决了“有”的问题（存进去，取出来）。V2 版本：解决了“准”的问题（PDF 解析优化、Re-rank）。V3 版本：解决了“新”的问题（联网搜索）。V4 版本：解决了“智”的问题（Agent 推理、主动推荐）。通过合理组合等生产级工具，我们才能构建出一个真正可用的企业级知识库。

2025-11-21 10:46:36 877

原创生产级 RAG 系统构建：LangChain 实践、案例与优劣分析

从 Demo 到生产，RAG 的瓶颈通常不在 LLM 本身，而在数据工程（Data Engineering）和检索策略（Retrieval Strategy）。初期：用 LangChain 默认组件快速跑通。中期：引入混合检索、重排序和元数据过滤，解决准确率问题。后期：针对特定数据格式（如表格、PDF）定制 Loader 和 Chunking 策略，建立完善的评估（Eval）体系。

2025-11-21 10:27:54 674

原创 Agent Prompt 工程指南：从定义到自动化优化的生产级实践

一个健壮的 Agent 系统，其 Prompt 是模块化的。我们需要针对System（系统层）Planner（规划层）Executor（执行层）和Reflector（反思层）分别定义指令。这是 Agent 的“宪法”。在生产中，单纯的“你是一个助手”是无效的，必须包含任务目标行为约束和输出协议。优化策略：使用XML 标签隔离上下文，防止指令漂移。生产级示例（SQL 数据分析 Agent）<role>你是一个资深的数据仓库专家（Data Warehouse Specialist）。

2025-11-20 14:15:16 879

原创 AI Agent 工程化指南：架构设计、规划模式与生产实践

构建生产级 Agent 系统，本质上是从“提示词工程（Prompt Engineering）”向“智能体工程（Agent Engineering）”的跨越。确定性与灵活性的平衡：核心业务流程使用 Flow Engineering 固化，边缘探索任务交给 ReAct 泛化。错误即资源：设计完善的反馈回路，将运行时错误转化为模型修正的上下文，而非简单的异常抛出。可观测性：建立完整的 Trace 链路（如 LangSmith），确保 Agent 的每一次思考和行动都可追溯、可分析。

2025-11-20 14:04:16 1205

原创从“直觉反应”到“自主思考”：LangChain 开发范式的三次跃迁

从面向 LLM到面向 Chain，再到面向 Agent，本质上是我们对 AI信任度LLM 时代：我们把 AI 当作一支笔。Chain 时代：我们把 AI 当作流水线上的工人。Agent 时代：我们把 AI 当作合作伙伴，只给目标，不问过程。随着LangGraph等新一代编排工具的出现，未来的 Agent 将具备更强的状态管理能力和多智能体协作能力，真正实现从“辅助工具”到“智能生产力”的跨越。

2025-11-19 22:36:38 607

原创 LangChain Agent 生产环境架构的经典挑战与应对策略

将 LangChain Agent 推向生产环境，本质上是从“提示词工程（Prompt Engineering）”向“软件工程（Software Engineering）”的跨越。维度Demo 阶段Production 阶段稳定性依赖运气依赖 Pydantic 校验与重试机制流程控制简单循环状态机 (LangGraph) + 熔断体验等待 Loading全链路流式 (Streaming)调试Print 打印分布式追踪 (Tracing)不要指望一个通用的能解决所有问题。

2025-11-19 18:15:17 647

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除