人工智能
文章平均质量分 81
小赖同学啊
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型领域中模型压缩与高效推理的核心技术之一:量化技术
它通过在精度和效率之间寻找最佳平衡点,使得庞大的模型能够运行在资源受限的设备上,并实现实时或准实时的推理。对称量化更简单,计算开销更小,但如果原始张量分布不对称,会浪费一部分整数表示范围。在深入了解量化之前,首先要明白其驱动力。这样,整个计算的核心部分就从FP32计算转移到了高效的INT8计算上。给定一个浮点数张量 ( F ),我们将其量化为整数张量 ( Q )。将整数张量 ( Q ) 转换回近似的浮点数张量 ( F’ )。这是量化技术的核心分类,理解它们至关重要。量化的精细程度不同,对精度的影响也不同。原创 2025-10-08 14:43:32 · 814 阅读 · 0 评论 -
PyTorch 的 Autograd 系统进行一次全面且深入的详解
叶子张量:用户直接创建的张量,不是通过操作产生的非叶子张量:通过对叶子张量进行操作得到的张量x = torch.tensor(2.0, requires_grad=True) # 叶子张量y = x ** 2 # 非叶子张量z = y + 1 # 非叶子张量ctx.save_for_backward(input) # 保存输入供反向传播使用grad_input[input < 0] = 0 # ReLU的导数# 使用自定义函数。原创 2025-10-08 12:06:37 · 780 阅读 · 0 评论 -
全面详解 PyTorch 中的优化器
学习率是首要超参数: 如果损失不下降(LR太小)或变成NaN(LR太大),首先调整学习率。使用学习率查找器是一个好方法。Adam/AdamW 的默认参数通常很好和eps=1e-8在绝大多数情况下不需要修改。权重衰减很重要: 即使是很小的值(如 1e-4)也能显著影响泛化能力。配合学习率调度器: 静态的学习率通常不是最优的,使用调度器(如余弦退火或)能带来巨大提升。监控训练过程: 使用 TensorBoard 或 WandB 监控损失和梯度直方图,这能帮助你诊断优化问题。原创 2025-10-08 11:55:10 · 1291 阅读 · 0 评论 -
GraphRAG 一种将知识图谱与检索增强生成相结合的高级 RAG 架构
GraphRAG是一种将知识图谱与检索增强生成相结合的高级 RAG 架构。它的核心思想不是将文档简单地切分成孤立的文本块,而是从整个文档集中提取出实体、概念以及它们之间的复杂关系,构建一个结构化的、全局的知识图谱。在回答问题时,系统从这个图谱中检索相关的子图作为上下文,提供给 LLM 生成答案。传统 RAG:检索与问题最相似的几段文本。GraphRAG:检索与问题最相关的一组相互关联的事实和概念。GraphRAG代表了 RAG 技术发展的一个重要方向,它通过引入符号主义(知识图谱)来增强连接主义。原创 2025-10-08 11:40:38 · 877 阅读 · 0 评论 -
LangGraph是一个基于图计算的大语言模型应用开发框架
LangGraph是一个基于图计算的大语言模型应用开发框架,它通过将复杂任务分解为多个节点并构建执行图来实现高效的LLM应用开发。使用前请替换示例中的OpenAI API密钥,并根据实际需求调整节点和图谱结构。原创 2025-07-19 16:24:42 · 855 阅读 · 0 评论 -
LangGraph Core 深度使用指南
构建下一代语言智能系统的核心引擎LangGraph Core 是一个革命性的语言图处理框架,通过将与深度融合,实现复杂语言任务的建模与执行。原创 2025-06-22 17:40:00 · 1199 阅读 · 0 评论 -
LangServer 与 Langgraph 融合架构:构建智能语言服务系统
通过LangServer与Langgraph的融合,可构建响应速度提升3倍、准确率提高40%的新一代语言智能平台,为开发者提供语义级智能辅助。建议采用开源核心+商业扩展模式推进生态建设。LangServer(语言服务器协议)与 Langgraph(语言图模型)的结合将创造新一代智能语言处理平台,实现从底层语言理解到高层应用服务的全链路增强。LangServer 接口服务。Langgraph 语义理解。LangServer接口。Langgraph引擎。Langgraph解析。带领域知识的补全建议。原创 2025-06-21 15:08:55 · 1498 阅读 · 0 评论 -
LangServe 使用指南与实例详解
chain.py# 翻译链translate_template = """将以下文本从{source_lang}翻译为{target_lang}:\n{text}"""# 摘要链summarize_template = """为以下文本生成摘要:\n{translated_text}"""# 组合链# app.py# 添加多个路由点# 创建自定义序列化器return BaseModel # 使用默认输入模式return CustomResponse # 自定义输出模式。原创 2025-06-19 18:41:16 · 1197 阅读 · 0 评论 -
LangSmith Agent测试监控方案实现路径
创建监控仪表盘panels=["name": "响应延迟",},"name": "准确率矩阵","""检查响应是否包含品牌敏感词"""PROHIBITED_TERMS = ["竞争对手", "负面词汇", "敏感政治术语"]return {# 注册自定义评估器description="品牌安全合规性检查"原创 2025-06-19 18:37:30 · 1407 阅读 · 0 评论 -
LangSmith 深度解析:构建企业级LLM应用的全生命周期平台
可观测性挑战通过细粒度追踪实现黑盒透明化质量保障挑战构建持续评估验证体系生产运维挑战提供企业级监控告警能力合规审计挑战满足金融/医疗等严格合规要求实施价值开发效率提升40%生产事故减少70%模型迭代速度提升3倍合规审计成本降低90%“LangSmith 不是简单的监控工具,而是LLM应用的全生命周期操作系统 —— 它让AI应用的迭代从艺术变为工程”原创 2025-06-17 19:29:08 · 1160 阅读 · 0 评论 -
LangSmith 的示例,展示如何通过SDK 调试和监控一个简单的 LLM 应用
退款物流商品推荐用户问题:{question}分类结果:"""根据用户问题和分类结果,生成回答:分类:{category}用户问题:{question}回答:"""# 分类问题# 生成响应# 模拟外部工具调用(例如搜索)if category_result == "商品推荐":search_results = search.run(f"推荐 {question.split()[-1]} 相关商品")原创 2025-06-16 17:23:40 · 618 阅读 · 1 评论 -
LangGraph 深度测试指南:端到端与节点级测试策略
服务水平目标latency:p99: 2.5smax: 5s分层测试策略节点级:100%单元测试覆盖 + 性能基准工作流级:关键路径100%覆盖 + 异常流覆盖系统级:真实场景模拟 + 混沌测试测试数据管理# 测试数据版本控制metadata={生产近似的测试环境使用相同版本的LLM模型数据库负载模拟网络延迟注入自动化覆盖率提升# 自动生成边界测试持续监控测试有效性# 跟踪测试捕获的生产缺陷})节点级可靠性:99.99%无缺陷执行工作流完整性。原创 2025-06-16 10:00:00 · 1049 阅读 · 0 评论 -
LangGraph AI 系统测试与高可用保障体系
分层测试策略:70%单元测试 + 20%集成测试 + 10%端到端测试真实故障模拟:每月执行混沌工程测试性能持续监测:建立性能基准库,阻止性能退化多级回滚机制自动回滚:当错误率 > 5%手动回滚:关键业务功能异常数据回滚:状态数据版本控制容量规划:# 自动伸缩规则99.95%可用性:全年停机时间 < 4.38小时故障恢复:RTO < 5分钟,RPO < 1分钟性能保障:P99延迟 < 2秒 99%的时段关键洞察:LangGraph系统的可靠性不是通过避免故障实现,而是通过。原创 2025-06-15 16:42:45 · 1228 阅读 · 0 评论 -
LangGraph 深度应用指南:构建下一代Agent系统
状态驱动:维护跨节点的上下文灵活路由:实现复杂决策逻辑循环支持:处理迭代式任务多Agent协同:构建智能团队实战建议从简单工作流开始,逐步增加复杂度使用检查点机制处理长时工作流为关键节点添加人工审核环节实施全面的监控和错误处理利用LangSmith进行持续优化“LangGraph 不是另一个工作流引擎,而是AI应用的神经系统——它使智能体能够像生物系统一样感知、思考和行动。原创 2025-06-15 16:35:38 · 1092 阅读 · 0 评论 -
LangServe 完整使用指南:部署LangChain应用到生产环境
fill:#333;color:#333;color:#333;fill:none;LangChain应用LangServe封装REST API客户端调用自动文档监控集成topic: strstyle: str = "专业"app,原创 2025-06-13 18:49:08 · 1257 阅读 · 0 评论 -
Langfuse 深度使用指南:构建可观测的LLM应用系统
Langfuse 是专为大语言模型(LLM)应用设计的开源可观测性平台,提供全链路追踪、分析调试和成本管理功能。原创 2025-06-11 19:53:14 · 1711 阅读 · 0 评论 -
基于LangGraph的Agent测试方案与过程
单元测试 测试Agent的独立模块(如意图识别、回复生成) pytest(Python)、unittest。集成测试 测试Agent与外部系统(如数据库、API)的交互 Postman、自定义Mock服务。安全加固:安全测试确保Agent能抵御常见攻击(如SQL注入、敏感信息泄露)。功能覆盖:通过单元测试、集成测试和端到端测试,确保Agent的核心功能稳定。鲁棒性测试:验证Agent对异常输入(如乱码、无意义问题)的处理能力。场景化覆盖:模拟真实业务场景(如客服、知识问答)的对话流程。原创 2025-06-10 15:07:56 · 887 阅读 · 0 评论 -
AI 维护工具之 Langfuse:深度解析与应用场景
Langfuse 是一个专为 AI 应用(尤其是基于 LLM 的系统) 设计的可观测性(Observability)与维护工具,旨在帮助开发者监控、调试和优化 AI 应用的性能、成本和用户体验。Langfuse 请求追踪、性能监控、成本分析 LLM 应用、AI 工具链 专注 AI 场景,深度集成 LLM 需集成 SDK,学习成本较高。请求追踪(Request Tracing):记录 AI 应用的每一次请求(如 LLM 调用、工具链执行)的输入、输出和上下文。原创 2025-06-10 09:15:00 · 1358 阅读 · 0 评论 -
Lang*生态系统多个专业框架及他们的作用
LangChain 生态系统已发展出多个专业框架,针对AI应用开发的不同环节提供解决方案。原创 2025-06-09 18:06:36 · 1293 阅读 · 0 评论 -
借助 LangGraph 对 Agent 进行测试
LangGraph 的状态流(Stateful Flow)特性使其成为测试复杂 Agent 系统的理想工具,尤其适用于需要模拟多轮交互、上下文依赖或动态决策的场景。流程控制:用节点(Node)和边(Edge)模拟 Agent 的行为路径,支持条件分支。包含 Agent 的内部状态(如记忆、知识库)和测试环境状态(如历史对话、用户画像)。状态管理:通过 State 对象跟踪 Agent 的内部状态(如记忆、知识库)。动态决策:Agent 的行为需根据状态变化(如用户输入、环境反馈)动态调整。原创 2025-06-09 17:48:18 · 563 阅读 · 0 评论 -
LangGraph 应用实例解析
LangGraph 是基于状态流(Stateful Flow)的框架,专为构建复杂、多轮对话或动态交互的 LLM(大语言模型)应用设计。它通过节点(Node)和边(Edge)的图形化结构,将对话逻辑拆解为可复用的组件,支持动态状态跟踪、上下文记忆和条件分支,适用于需要长期上下文依赖或复杂决策流程的场景。玩家属性(生命值、物品)、NPC状态(好感度、剧情进度)存储在 State 中。节点内部调用LLM API(如OpenAI)生成动态内容(如对话、报告)。原创 2025-06-09 17:44:31 · 925 阅读 · 0 评论 -
LangGraph 深度解析:下一代AI应用编排引擎
有点像skywalkingLangGraph是LangChain生态系统中的,专为构建复杂、多步骤的AI应用而设计。原创 2025-06-09 17:31:52 · 1399 阅读 · 0 评论 -
AIGC(AI Generated Content)测试结合自动化工具与人工评估
通过系统化测试框架+工具链组合,可降低50%内容风险,提升生成质量达标率至90%+。四大维度,结合自动化工具与人工评估。AIGC(AI Generated Content)测试需覆盖。原创 2025-06-09 15:14:45 · 339 阅读 · 0 评论 -
AURA智能助手在物联网(IoT)和数字化改造领域的使用
要设计一款在物联网(IoT)和数字化改造领域占据市场主导的AURA智能助手,产品经理需从行业痛点、技术架构、商业模式、生态整合四大维度切入,深度融合工业场景的特殊性。以下是系统性设计框架与落地策略:MQTT/OPC UA协议毫秒级响应非关键数据设备层边缘节点实时决策设备控制云平台长期趋势分析边缘层:轻量化模型处理实时控制(<50ms延迟)云端:大模型训练全局优化策略2. 工业多模态融合数据兼容性:支持PLC、SCADA、MES等30+工业协议智能诊断引擎:振动频谱 + 红外热成像 → 轴原创 2025-06-08 17:34:26 · 955 阅读 · 0 评论 -
基于大模型的 UI 自动化系统
自然语言交互:用户使用日常语言描述操作需求视觉场景理解:系统实时分析屏幕内容自适应执行:动态适应界面变化多平台支持:可扩展至Web、桌面、移动端未来扩展方向集成多模态模型实现更精准的视觉定位增加语音交互支持开发长期记忆和个性化配置实现端到端的工作流自动化此系统特别适用于需要处理复杂、动态界面的自动化场景,大大降低了自动化脚本的编写和维护成本。原创 2025-06-06 16:26:13 · 1311 阅读 · 0 评论 -
Aura AI 智能助手产品规划
Aura AI 是一款多模态智能助手,通过自然语言交互理解用户需求,提供个性化服务,成为用户的「数字分身」和「效率伙伴」。原创 2025-06-06 09:41:06 · 885 阅读 · 0 评论 -
ASR技术(自动语音识别)深度解析
截至2023年,最先进ASR系统(如OpenAI Whisper)在LibriSpeech测试集上词错率(WER)已达1.5%,接近人类水平(1-3%)。技术发展正从“能听清”向“听懂意图”演进,与NLP的深度结合成为关键突破点。原创 2025-06-03 17:05:36 · 1565 阅读 · 0 评论 -
ASR技术(自动语音识别)深度解析
截至2023年,最先进ASR系统(如OpenAI Whisper)在LibriSpeech测试集上词错率(WER)已达1.5%,接近人类水平(1-3%)。技术发展正从“能听清”向“听懂意图”演进,与NLP的深度结合成为关键突破点。原创 2025-06-03 16:59:08 · 1133 阅读 · 0 评论 -
利用RAGAS评测RAG产品的自定义评测指标实现
实际应用建议指标选择:根据你的RAG系统应用场景选择或设计合适的指标基准测试:先使用默认指标建立基准,再逐步添加自定义指标模型集成:对于复杂指标,考虑使用轻量级模型或API服务性能考虑:自定义指标可能会增加评估时间,特别是涉及模型推理时结果解释:为自定义指标提供清晰的文档,说明其计算方式和评估意义完整示例代码pythondefinitsuper().initreturn {definitsuper().initreturn {原创 2025-05-29 10:04:41 · 1063 阅读 · 0 评论 -
前端开发与LangChain深度集成指南
分模块集成不同LangChain功能,同时建立完善的。LangChain服务层。原创 2025-05-26 14:08:09 · 1299 阅读 · 0 评论 -
MCP(大模型协议文本)服务 的详细解析
(如阿里云、华为的定制化解决方案),建议提供更多上下文以便精准解析。(模型协作协议),是一种专为。设计的标准化协议或服务框架。若您指的是某个特定厂商的。的详细解析,结合其在。原创 2025-05-11 14:12:52 · 946 阅读 · 0 评论 -
Cursor款基于人工智能技术的代码编辑器,简直太爽了
对于开发者而言,Cursor 尤其适合:需要快速迭代的项目、跨语言开发任务、独立开发者或小型团队。建议从测试项目开始试用,逐步适应 AI 辅助编程的新范式。Cursor 是一款基于人工智能技术的代码编辑器,专为开发者设计,旨在提升编程效率。原创 2025-05-11 14:09:50 · 507 阅读 · 0 评论 -
模型实时自主训练系统设计
通过结合流式计算框架和现代MLOps实践,本设计为构建自适应智能系统提供了可靠的技术方案。原创 2025-05-10 10:30:00 · 748 阅读 · 0 评论 -
大数据与物联网技术在大模型应用中的整合架构设计
通过将大数据与物联网的工程化能力与大模型的认知能力深度结合,可构建出具有自我进化能力的智能系统,推动产业智能化进入新阶段。原创 2025-05-08 07:34:49 · 1183 阅读 · 0 评论 -
让模型具备“道生一,一生二,二生三,三生万物”的现实实用主义能力
要让模型具备“道生一,一生二,二生三,三生万物”的现实实用主义能力,需从哲学思想中提炼核心逻辑,结合现代AI技术构建一个从简单到复杂、从抽象到具体、从静态到动态的演化体系。道生一 基础模型(Foundation Model) 建立统一的世界观(World Model)一生二 任务解耦与模块化 分解为可组合的原子能力。二生三 多模态融合与因果推理 实现跨领域知识迁移。三生万物 开放环境自适应 生成无限场景的解决方案。哲学阶段 技术隐喻 核心目标。一、哲学思想的技术解构。原创 2025-05-09 16:15:00 · 415 阅读 · 0 评论 -
技术方案模型需要兼顾战略规划、技术实现与落地可行性
打造一个技术方案模型需要兼顾战略规划、技术实现与落地可行性,需从需求分析、技术选型、架构设计、实施路径、风险管控五大维度系统化推进。通过系统化设计,技术方案可实现从“需求模糊”到“价值可量化”的转化,关键在于将业务目标拆解为可执行的技术任务,并通过工具链与流程管控确保落地。定期重构代码(如通过SonarQube检测代码异味)数据层:构建实时库存数据湖(Delta Lake)供应商协同效率提升4倍(API调用量日均百万级)需求:将库存周转率提升30%,缺货率降低50%应用层:供应商协同平台(含API市场)原创 2025-05-10 17:15:00 · 740 阅读 · 0 评论 -
模型智能编排算法与智能推荐
自适应优化 多臂老虎机(MAB):在线探索模型效果,平衡 exploitation(利用已知最优)与 exploration(探索新模型)编排框架:Kubeflow(K8s原生)、Seldon Core(模型服务)、Ray Serve(分布式推理)元数据管理 模型卡(Model Card):记录模型类型、输入输出格式、性能指标(如F1/AUC)模型池:包含协同过滤(新用户)、深度学习模型(活跃用户)、强化学习模型(高价值用户)基模型:XGBoost(高召回)、孤立森林(异常检测)、NLP模型(文本分析)原创 2025-05-08 12:45:00 · 411 阅读 · 0 评论 -
大数据、物联网(IoT)、平台架构与设计重构大模型应用
通过此架构,可实现从设备端数据采集到智能决策的完整闭环,充分发挥大数据的规模效应与物联网的实时性,同时利用大模型的泛化能力解决复杂场景问题。结合大数据、物联网(IoT)、平台架构与设计重构大模型应用,需构建一个数据驱动、实时响应、弹性扩展的智能系统。[物联网设备层] → [边缘计算层] → [大数据平台层] → [AI模型服务层] → [应用层]解决方案:构建统一元数据管理(Apache Atlas),实现跨协议数据映射。解决方案:MLflow + DVC(数据版本控制)实现端到端追踪。原创 2025-05-07 19:56:25 · 1463 阅读 · 0 评论 -
模型中台建设全流程指南
【代码】模型中台建设全流程指南。原创 2025-05-07 19:50:36 · 1086 阅读 · 0 评论 -
大模型外挂数据库集成架构与接口设计
该架构可使大模型在实际业务场景中的准确率提升35-50%(基于行业基准测试),同时将数据运维成本降低60%以上。原创 2025-05-08 10:45:00 · 1075 阅读 · 0 评论
分享