基于LangChain4j UserMessage的Token计算实践

一句话总结

基于UserMessgae进行token计算,让大模型应用飞得更稳。٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

模型计算公式(以通义千问为例)

大模型应用开发中,Token计算是影响效果与成本的核心问题,我们面临以下痛点:

  • 需要实时监控Token消耗,以便后续进行阈值预警
  • 大模型Token限制:超限会导致截断或请求失败
  • 动态优化的需求

DeepSeek经常timeout,这个用通义千问模型为例, https://help.aliyun.com/zh/model-studio/getting-started/models?spm=a2c4g.11186623.0.0.3adc55ef9UIH28
在这里插入图片描述

UserMessage快速了解

在这里插入图片描述
快速使用

UserMessage userMessage = UserMessage.from(prompt);

返回的结果

Response { 
content = AiMessage { text = "[具体的回答内容]" toolExecutionRequests = null }, 
tokenUsage = TokenUsage { inputTokenCount = 10, outputTokenCount = 86, totalTokenCount = 96 }, finishReason = STOP, 
metadata = {} 
}

tokenUsage 包含:输入的Token+输出的Token计算
结合计算公式
但是⚠️注意这里的Token计算是不完善的。

未来展望

只是开始,可以期待MCP.从N✖️N到 One for All,用更简单、更可靠的方式获取获取所需的数据,计算更可靠的Token消耗。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值