人工智能_大模型035_LLM大模型开发工具链001_大模型产品测评调试_调用过程监控LangFuse_LangFuse监控原生调用模型以及监控LangChain调用模型---人工智能工作笔记0170

本文介绍了维护大型语言模型应用所需的关注点,如监控、调试和数据管理,并重点解析了开源工具LangFuse的功能和使用,包括如何集成LangChain、OpenAI API,以及在本地和云端的部署方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

## 维护一个生产级的 LLM 应用,我们需要做什么?

1. 各种指标监控与统计:访问记录、响应时长、Token 用量、计费等等
2. 调试 Prompt
3. 测试/验证系统的相关评估指标
4. 数据集管理(便于回归测试)
5. Prompt 版本管理(便于升级/回滚)
 

## 针对以上需求,我们介绍三个生产级 LLM App 维护平台
1. 重点讲解 **LangFuse**: 开源 + SaaS(免费/付费),LangSmith 平替,可集成 LangChain 也可直接对接 OpenAI API;
2. 简单讲解 **LangSmith**: LangChain 的官方平台,SaaS 服务(付费),非开源;
3. 简单讲解 **Prompt Flow**:微软开发,开源 + Azure AI 云服务,可集成 Semantic Kernel(但貌合神离)。
 

上面是自己在本地搭建的langfuse服务.和大模型的交互过程都被记录在了这个平台上.

每一个详细的情况都可以查看.跟AI助手的交互在这里都可以看

<think>好的,用户想了解DeepSeek开源版本的列表。我需要根据提供的引用资料来整理相关信息。首先,引用3提到了DeepSeek提供的模型版本,包括1.5b、7b、8b、14b、32b、70b和671b。这些版本对应的参数规模各不相同,适用于不同的场景,比如1.5b适合一般文字编辑,而更大的版本如70b和671b需要更多存储空间。 接着,引用4详细介绍了DeepSeek-V3系列,特别是DeepSeek-V3和DeepSeek-V3-Base,参数规模达到671B,并提到了一些技术创新,如FP8混合精度训练和MoE架构。这些信息需要整合到版本列表中,说明每个版本的特点和发布时间。 用户可能需要了解不同版本之间的区别,比如参数规模、适用场景以及技术优势。例如,671b版本虽然需要404GB空间,但在数学和代码任务上表现优异。同时,注意引用中的时间信息,如DeepSeek-V3在2024年12月发布,而其他版本可能在更早的时间点。 需要确保回答的结构清晰,分点列出不同版本,并注明每个版本的参数、特点和引用来源。此外,用户可能对如何选择合适版本有疑问,可以建议根据计算资源和需求来选择。最后,生成相关问题,帮助用户进一步探索,比如应用场景或安装方法。</think>根据引用内容,DeepSeek开源模型包含以下主要版本(截至2024年12月信息): 一、基础推理模型系列(引用[3]) 1. $1.5b$版:适用于基础文字处理 - 存储需求:1.1GB - 调用命令:`ollama run deepseek-r1:1.5b` 2. $7b$版:第一代推理模型 - 性能对标OpenAI早期模型 - 存储需求:4.7GB 3. $14b$版:中等规模模型 - 存储需求:9GB - 支持长文本推理 4. $70b$版:高性能版本 - 存储需求:43GB - 适用于复杂任务处理 二、突破性模型(引用[4]) $$ \text{DeepSeek-V3 (671b)} $$ - 总参数:$671B$ - 激活参数:$37B$ - 技术创新: - FP8混合精度训练 - 多头潜在注意力(MLA) - MoE混合专家架构 - 性能指标: - MATH评测:$61.6$ EM - HumanEval:$65.2$ Pass@1 - 生成速度:$60$ TPS - 支持$128K$长上下文 三、专业优化版本(引用[4]) $$ \text{DeepSeek-V3-Base} $$ - 原生支持FP8权重 - 适配TensorRT-LLM等推理框架 - 显存消耗降低$30\%$
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

添柴程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值