LangSmith 的示例，展示如何通过SDK 调试和监控一个简单的 LLM 应用

最新推荐文章于 2025-12-04 18:10:19 发布

原创

最新推荐文章于 2025-12-04 18:10:19 发布 · 601 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#大数据 #人工智能 #数据库

以下是使用 LangSmith 的 Python 代码示例，展示如何通过其 SDK 调试和监控一个简单的 LLM 应用。此示例模拟一个电商客服机器人，根据用户输入分类问题类型并生成响应。

环境准备
首先安装必要的库：

bash
pip install langchain langsmith
示例代码：电商客服机器人调试
python
from langchain import PromptTemplate, LLMChain
from langchain.chat_models import ChatOpenAI
from langchain_community.utilities import GoogleSearchAPIWrapper
from langsmith import Client, run
from langsmith.scenarios import run_scenario

初始化 LangSmith 客户端

client = Client(
    base_url="https://api.smith.langchain.com",  # LangSmith 服务地址
    api_key="YOUR_API_KEY",  # 替换为你的 API Key
)

定义分类提示模板

classification_template = “”"
根据用户问题，分类

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小赖同学啊

关注关注

7
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

LangSmith Agent测试监控方案实现路径

主攻大数据人工智能物联网安全低空经济等方向。mtsc 、gtest特邀分享嘉宾

06-19

1400

创建监控仪表盘panels=["name": "响应延迟",},"name": "准确率矩阵","""检查响应是否包含品牌敏感词"""PROHIBITED_TERMS = ["竞争对手", "负面词汇", "敏感政治术语"]return {# 注册自定义评估器description="品牌安全合规性检查"

大模型链路调试平台之LangSmith实战指南

猫步轻移，以学求知。余于此方寸之地，如猫观鼠，细察技艺所得，思维所悟。灵思如猫之警觉，日积月累，终成智海；

06-09

1493

在人工智能应用开发中，大语言模型的非确定性输出特征使得传统调试方法面临前所未有的挑战。当智能体应用变得日益复杂时，开发者往往难以快速定位问题根源，更无法有效评估模型在生产环境中的真实表现。本文深入解析LangSmith这一专业的大模型应用调试监控平台，为开发者提供系统化的解决方案。文章首先剖析了大模型应用开发中的三大核心挑战：调试复杂性、测试验证困难以及生产环境监控缺失。随后详细介绍了LangSmith的技术架构和功能体系，包括执行链路追踪、提示词效果分析、模型版本对比等核心模块。

1 条评论您还未登录，请先登录后发表或查看评论

2 条评论

阡陌℃c 2025.08.04
请问一下langsmith可以本地化部署吗，数据相关不使用其自带的云平台，改成自己内网的服务器？
- 小赖同学啊回复阡陌℃c 2025.09.04
  可以，找到源码和安装包即可

LangSmith：大模型应用调试利器

Q2024107的博客

08-25

936

摘要：LangSmith是LangChain团队推出的LLM应用全流程开发工具，解决了大模型应用开发中的"黑箱"问题。它通过追踪树结构可视化执行流程，记录提示词、模型调用和Token消耗等关键数据，将LLM开发从依赖直觉的"炼金术"转变为数据驱动的工程实践。LangSmith具备三大核心功能：1）评估功能实现测试驱动的迭代；2）监控仪表盘实时追踪生产环境指标；3）PromptHub和Playground支持团队协作的提示词工程。该工具显著提升了LLM应用的可观测性，支

LangSmith SDK 使用教程

gitblog_01130的博客

09-04

485

LangSmith SDK 使用教程 1. 项目的目录结构及介绍 langsmith-sdk/ ├── README.md ├── langsmith/ │ ├── __init__.py │ ├── client.py │ ├── wrappers.py │ └── ... ├── tests/ │ ├── __init__.py │ ├── test_client.py...

LangSmith的简单介绍

Major_S的博客

02-24

1089

LangSmith 是一个功能强大的开源工具，专为开发基于语言模型的应用而设计，提供了从调试到优化的全方位支持。通过强大的监控、调试、回溯和优化功能，LangSmith 帮助开发者理解和控制语言模型的表现，确保应用的稳定性和高效性。无论是对话系统、文档处理，还是多步骤推理任务，LangSmith 都能提供强大的支持，帮助开发者提高工作效率并优化模型的效果。

大模型数据分析平台 LangSmith 介绍

2401_84495872的博客

08-01

1930

LangSmith] 是 LangChain 自主研发的 LLM 应用程序开发、监控和测试的平台。LangChain 是一款使用 LLM 构建的首选开源框架，一个链接面向用户程序和 LLM 之间的一个中间层，允许 AI 开发者将像 GPT-4 、等大型语言模型与外部的计算和数据源有机结合起来。目前，它提供了 Python 和 JavaScript（确切地说是 TypeScript）的软件包。

开源模型应用落地-LangSmith试炼-入门初体验-追踪代码（一）

热门推荐

以微薄之力，予他人些许温暖.

05-19

1万+

探索如何使用LangSmith实现更高效地进行模型相关的开发、调试和管理

深入探索LangSmith Client SDKs：解锁语言模型的调试与监控新境界

gitblog_00043的博客

06-08

995

深入探索LangSmith Client SDKs：解锁语言模型的调试与监控新境界在人工智能领域，尤其是在自然语言处理（NLP）的前线，数据的有效追踪和模型的精细调优至关重要。今天，我们将聚焦于一款强大工具——LangSmith及其配套的客户端SDKs，这是由LangChain公司倾力打造，专为解决语言模型应用中的关键挑战而生的神器。项目介绍 LangSmith是一个先进的平台，它为团队提供了...

开源模型应用落地-LangSmith试炼-入门初体验-获取用户反馈（四）

以微薄之力，予他人些许温暖.

05-27

6768

学习Human feedback功能，帮助用户从应用程序中捕获用户反馈，并将其与跟踪记录关联起来

两个 LLM 工程平台到底选哪个？LangSmith 和 LangFuse 全面对比

nielilijy的专栏

09-19

1235

摘要：本文对比了LangSmith和LangFuse两大LLM开发平台，分别代表闭源商业化和开源自托管路线。LangSmith深度集成LangChain生态，擅长链条调试与AI评估；LangFuse则支持多框架，提供灵活追踪和混合评估机制。通过法律问答助手的开发示例，展示了二者在追踪（RunTree vs Trace+Span）、数据集构建、Prompt版本控制和评估方式（纯AI评估 vs LLM+人工反馈）的差异。结论指出：LangSmith适合LangChain深度用户，而LangFuse更适配需要开源

LangChain 与 LangSmith：构建与微调支持LLM的智能应用双重攻略

FrenzyTechAI的博客

09-05

8946

随着人工智能领域的不断发展，自然语言处理 (NLP) 技术也在不断进步。近年来，革命性的大型语言模型 (LLM) 已经成为了 NLP 技术的重要组成部分。作为一种可以理解并生成类似人类的文本的技术，LLM 已经在机器翻译、情感分析、聊天机器人和内容生成等任务中发挥了重要作用。在这个以语言为桥梁的世界中，LLM 的应用前景无限，而 LangChain 创新平台则是充分利用 LLM 潜力的重要手段。在本文中，我们将探索 LLM 的奇迹，并介绍如何使用 LangChain 构建 LLM 支持的应用程序。

LangChain 76 LangSmith 从入门到精通一

AI架构师易筋

02-02

2299

LangChain使得原型化LLM应用程序和代理变得容易。然而，将LLM应用程序交付到生产环境可能会出乎意料地困难。您将不得不对提示、链条和其他组件进行迭代，以构建高质量的产品。LangSmith使得调试、测试和持续改进LLM应用程序变得容易。这在什么时候可能会派上用场？

Python----大模型（RAG 的智能评估-LangSmith）

weixin_64110589的博客

07-26

787

LangSmith是大模型应用开发平台，提供构建、测试、评估和监控LLM应用的全流程工具。文章详细介绍了使用LangSmith进行自动化评估的完整流程：1）安装配置LangSmith环境；2）连接本地LLM模型（如Qwen2.5-7B-Instruct）；3）构建RAG应用链；4）定义多种评估器（包括简洁度、余弦相似度等）；5）执行自动化评估并上传结果。文中还演示了如何创建数据集、配置评估指标，以及连接向量数据库实现检索增强生成（RAG）。该平台支持开发者从原型到生产环境的全生命周期管理，显著提升大模型应用

共享出行数字化转型：车辆调度 AI 优化与用户体验数据化迭代实践

九河智造云的内容中心

12-02

435

某头部共享出行企业的实践显示，AI 调度系统上线后，车辆应答率提升 40%，用户平均候车时间从 12 分钟缩短至 6.5 分钟，车辆日均周转率提高 32%，运营效率显著提升。车辆调度 AI 优化与用户体验数据化迭代的实践，不仅解决了传统运营中的效率低、体验差等问题，更构建了以数据为核心的竞争优势。随着 AI、物联网、5G 等技术的持续迭代，未来将实现车辆调度、服务优化、安全管控的全链路智能升级，为用户提供更便捷、安全、个性化的出行服务，同时为城市交通可持续发展注入持久动能。

对称美学-od

最新发布

用来自己学习，复习

12-04

210

就是第 i 个字符串 = 第 i - 1 号字符串的取反 + 第 i - 1 号字符串;取反(R->B, B->R);现在告诉你 n 和 k，让你求得第 n 个字符串的第 k 个字符是多少。根据规律：S(n) = invert(S(n-1)) + S(n-1)长度 L(n) = 2^(n-1)，前半长度 = 2^(n-2)重复这个过程，直到 n = 1，S1 = "R"接下里输入T行，每行输入两个数字，表示n, k。第 4 个字符串：BRRBRBBR。第 2 个字符串：BR。第 1 个字符串：R。

大模型应用：大模型 MapReduce 全解析：核心概念、中文语料示例实现.12

minhuan的专栏

12-03

1071

本文介绍了MapReduce编程模型及其在大模型训练中的应用。MapReduce通过"分治-并行-聚合"思想处理大规模数据，传统Hadoop MapReduce侧重结构化数据计算，而大模型MapReduce则针对自然语言处理任务。文章详细对比了两者在架构、处理对象和核心算力等方面的差异，并提供了中文词频统计的Python实现示例，包括单机版和分布式版本。分布式实现利用多进程模拟集群计算，展示了数据分片、Map、Shuffle和Reduce的完整流程。

国产时序数据库供应商排名

weixin_43836476的博客

12-04

285

测试显示，在处理海量数据时，TDengine的压缩比可达10:1 - 50:1，大幅减少了存储空间。：提供了丰富的客户端工具和开发接口，支持多种编程语言，如Python、Java、C++等，方便开发者进行集成和二次开发。：在监控领域有较高的知名度和市场占有率，很多企业的监控系统采用OpenTSDB来存储和分析时序数据，尤其是在互联网企业的运维监控场景中应用较为普遍。它提供了简单易用的SQL接口，与常见的数据分析工具如Grafana等有良好的集成，生态系统在不断完善。

ElasticSearch索引red，关键字 Too many open files

weixin_42566359的博客

12-04

117

摘要：当Elasticsearch索引状态显示为red时，若发现"Too many open files"错误，表明主机文件句柄数不足。

怎么搭建一个langchain项目示例，然后在langsmith上监控

01-21

### 构建 LangChain 示例项目并实现在 LangSmith 上的监控 #### 定义环境配置与依赖安装为了启动一个基于 LangChain 的项目，首先需要设置 Python 环境以及安装必要的库。这通常涉及到创建虚拟环境来隔离项目的依赖项。 ```bash python -m venv my-langchain-env source my-langchain-env/bin/activate # Linux/MacOS 或者对于 Windows 使用 `my-langchain-env\Scripts\activate.bat` pip install langchain langsmith ``` #### 初始化 LangChain 应用程序接下来，在本地环境中初始化一个新的 LangChain 应用程序实例。这里会涉及定义模型使用的模板、链路逻辑等核心组件[^1]。 ```python from langchain import PromptTemplate, LLMChain from langchain.llms import OpenAI # 创建提示模板 template = "你是一个擅长回答关于 {subject} 问题的语言模型." prompt = PromptTemplate(template=template, input_variables=["subject"]) # 设置大语言模型服务 llm = OpenAI(model_name="text-davinci-003") # 组合形成完整的处理链条 chain = LLMChain(prompt=prompt, llm=llm) ``` #### 集成 LangSmith 进行结果追踪为了让上述构建的过程能够被有效管理和优化，可以借助于 LangSmith 来记录每次调用的结果及其性能指标。这样做不仅有助于调试还便于后续迭代改进[^3]。 ```python import os from langsmith import Client as LangSmithClient client = LangSmithClient(api_key=os.getenv('LANGSMITH_API_KEY')) def log_to_langsmith(chain_output): client.create_run( name="example-run", run_type="tool", inputs={"input": chain_input}, outputs={"output": chain_output} ) # 假设我们有一个输入给定的主题 '人工智能' chain_input = {"subject": "人工智能"} result = chain.run(**chain_input) log_to_langsmith(result) print(f"Model Response: {result}") ``` 此段代码片段展示了如何将 LangChain 处理后的输出发送到 LangSmith 平台进行存储和分析。通过这种方式，开发者可以在平台上查看每一次交互的具体情况，并据此调整参数或算法设计以达到更好的效果。