15 LlamaIndex中的使用模式：预测LLM和嵌入标记计数

最新推荐文章于 2025-12-03 20:31:34 发布

原创

最新推荐文章于 2025-12-03 20:31:34 发布 · 596 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #机器学习 #深度学习

LlamaIndex中的使用模式：预测LLM和嵌入标记计数

在LlamaIndex中，为了测量LLM和嵌入的标记计数，你需要执行以下步骤：

设置MockLLM和MockEmbedding对象

首先，你需要设置MockLLM和MockEmbedding对象，这些对象将用于模拟LLM和嵌入调用，以便预测标记使用情况。

from llama_index.core.llms import MockLLM
from llama_index.core import MockEmbedding

llm = MockLLM(max_tokens=256)
embed_model = MockEmbedding(embed_dim=1536)

设置TokenCountingCallback处理程序

接下来，你需要设置TokenCountingCallback处理程序，该处理程序将使用tiktoken库来计算标记数。

import tiktoken
from llama_index.core.callbacks

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

需要重新演唱

关注关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

128 深入解析Llama Index的响应合成生成 llamaindex.core.response_synthesizers.generation.py

xycxycooo的博客

08-31

2589

通过本文的解析，我们深入了解了 Llama Index 中的生成器模块的工作原理和实际应用。通过配置不同的参数和提示模板，我们可以灵活地生成各种类型的响应。希望本文能帮助你更好地理解和应用 Llama Index 的生成器模块。

27 LlamaIndex中的节点解析器使用指南

xycxycooo的博客

08-20

987

在LlamaIndex中，节点解析器是一个简单的抽象，它接受一组文档，并将它们分割成节点对象，每个节点是父文档的一个特定块。当一个文档被分割成节点时，它的所有属性（如元数据、文本和元数据模板等）都会继承给子节点。你可以在阅读更多关于节点和文档属性的信息。

参与评论您还未登录，请先登录后发表或查看评论

使用LLM和嵌入模型进行Token计数

ppoojjj的博客

06-19

1314

随着大规模语言模型（LLM）和嵌入技术在自然语言处理（NLP）中的广泛应用，理解和估算这些模型在实际使用中的Token计数变得尤为重要。这篇文章将带你了解如何使用MockLLM和MockEmbedding对象来测量Token计数，并附上示例代码。

【谣传】不能完全取代HR

东方佑

06-06

863

这份研究论文提出了 MockLLM，一个利用大型语言模型（LLM）角色扮演能力来促进招聘场景中人和职位匹配的框架。它通过模拟面试过程来生成额外的匹配证据，从而提高匹配的准确性。MockLLM 旨在通过模拟面试过程来提高人和职位匹配的准确性，而不是取代 HR。

使用大模型检索增强 Rerank 模型，检索效果提升太明显了！

2201_75499313的博客

01-28

6869

RAG 是一种结合了信息检索和文本生成的语言模型技术。简单来说，当你向大语言模型（LLM）提出一个问题时，RAG 首先会在一个大型的文档集合中寻找相关信息，然后再基于这些信息生成回答。Rerank 的工作就像是一个智能的筛选器，当 RAG 从文档集合中检索到多个文档时，这些文档可能与你的问题相关度各不相同。有些文档可能非常贴切，而有些则可能只是稍微相关或者甚至是不相关的。这时，Rerank 的任务就是评估这些文档的相关性，然后对它们进行重新排序。它会把那些最有可能提供准确、相关回答的文档排在前面。

RAG工作流深度解析：数据摄取的艺术

2401_85390073的博客

08-19

1048

LlamaHub是一个扩展库，增强了核心框架的能力。LlamaHub包含许多集成类型，其中包括众多连接器（也称为数据读取器或数据加载器），它们专门用于允许外部数据与LlamaIndex无缝集成。目前有超过180个现成的数据读取器，涵盖广泛的数据源和格式，并且这个列表还在不断增加。这些连接器作为标准方式摄取数据，从数据库、API、文件和网站等来源提取数据，并将其转换为LlamaIndex文档对象。这使你无需为每个新数据源编写定制的解析器和连接器。

14 LlamaIndex中的成本分析：优化LLM应用的经济效益

xycxycooo的博客

08-19

684

SimpleKeywordTableIndex - 使用正则表达式关键词提取器从每个文档中提取关键词RAKEKeywordTableIndex - 使用RAKE关键词提取器从每个文档中提取关键词。

解读文本嵌入：语义表达的练习

我相信......

09-28

1618

【引子】近来在探索并优化AIPC的软件架构，AI产品经理关于语义搜索的讨论给了自己较多的触动，于是重新梳理嵌入与语义的关系，遂成此文。文本转换成机器可理解格式的最早版本之一是 ASCII码，这种方法有助于渲染和传输文本，但不能编码单词的意义，其标准的搜索技术是关键字搜索，寻找包含特定单词或 N-gram的所有文档。如今，我们可以计算单词、句子甚至图像的嵌入。嵌入也是数字的向量，但它们可以捕捉意义。...

[今日Arxiv] GraphRAG, 微软，使用LLM自动化构建图谱并检索生成

qq_29883477的博客

09-10

1488

使用检索增强生成 (RAG) 从外部知识源检索相关信息使大型语言模型 (LLM) 能够回答来自私有和/或之前未见过的文档集合的问题。然而，对于针对整个文本语料库的全局问题，如“数据集中的主要主题是什么？”RAG 却失败了，因为这本质上是一个查询聚焦摘要 (QFS) 任务，而不是一个明确的检索任务。与此同时，先前的 QFS 方法无法扩展到典型 RAG 系统索引的文本数量。为了结合这些对比方法的优点，作者提出了一种图 RAG 方法，用于在私有文本语料库上进行基于问题的回答。

构建 LLM （大型语言模型）应用程序——从入门到精通（第三部分：句子转换器）

weixin_44098716的博客

10-15

1053

通过检索增强生成 (RAG) 应用程序的视角学习大型语言模型 (LLM)。

节点解析器使用模式（Node Parser Usage Pattern）

xycxycooo的博客

07-31

757

节点解析器（Node Parser）是一个简单的抽象，它接受一组文档，并将它们分割成节点对象，每个节点是父文档的一个特定块。默认标签是：[“p”, “h1”, “h2”, “h3”, “h4”, “h5”, “h6”, “li”, “b”, “i”, “u”, “section”]，自动为每种类型的内容使用最佳的节点解析器。然后，你可能希望将基于文件的节点解析器与基于文本的节点解析器链接起来，以考虑文本的实际长度。这意味着单个输入将被分割成几个层次的块大小，每个节点包含对其父节点的引用。

50%测试效率提升：Ragbits MockLLM模块重构实战

gitblog_07788的博客

06-05

317

在构建生成式人工智能（Generative AI）应用时，开发团队常陷入测试困境： - **成本黑洞**：每次集成测试调用GPT-4成本高达$0.01/1K tokens，复杂场景单日测试成本超$200 - **稳定性陷阱**：真实LLM API响应延迟波动达300%，导致CI/CD流水线频繁失败 - **覆盖盲区**：极端边缘场景（如1000token超长提示）难以触发，生产环境突发异常 Ra...

TensorRT笔记（5）：研究timingCache

ouliten的博客

12-02

812

在里出现了大量的timingCache，但是当时没有取研究这是干啥的，本文就来解析一下。样例都基于上面的文章。

向量嵌入：RAG系统背后的语义引擎

uncle_ll的博客

11-29

1522

向量嵌入技术将高维语义信息压缩为低维向量，使相似概念在向量空间中聚集。作为RAG系统的核心，嵌入质量直接影响语义检索效果。从静态词嵌入到动态上下文嵌入，技术不断演进，解决了多义词等难题。现代嵌入模型基于Transformer架构，通过对比学习优化检索性能。选型需考虑MTEB排名、语言支持等维度，并结合业务测试。未来趋势包括多模态融合、知识图谱增强和轻量化部署。嵌入技术已成为NLP领域的关键支柱，其优化对提升RAG系统性能至关重要。

大模型应用：大模型 MapReduce 全解析：核心概念、中文语料示例实现.12

minhuan的专栏

12-03

857

本文介绍了MapReduce编程模型及其在大模型训练中的应用。MapReduce通过"分治-并行-聚合"思想处理大规模数据，传统Hadoop MapReduce侧重结构化数据计算，而大模型MapReduce则针对自然语言处理任务。文章详细对比了两者在架构、处理对象和核心算力等方面的差异，并提供了中文词频统计的Python实现示例，包括单机版和分布式版本。分布式实现利用多进程模拟集群计算，展示了数据分片、Map、Shuffle和Reduce的完整流程。

07_Spring AI 干货笔记之提示词

在科技的浪潮中，我们寻找着创新的火种，在代码的海洋里，我们编织着智慧的网。腾飞开源，就是这样一个由技术精英汇聚而成的博客平台，我们致力于分享在Java、Python、IoT和人工智能等领域的最新研究成果和实战经验。在腾飞开源的博客上，你会看到紧跟技术前

11-30

1737

本文详细介绍了Spring AI中的提示词核心概念与API设计。提示词作为引导AI模型生成特定输出的关键输入，其结构从简单字符串演进为包含多角色消息的复杂形式。Spring AI通过Prompt和Message接口提供结构化提示词管理，支持系统、用户、助手等角色分配。PromptTemplate类实现动态内容渲染，并支持自定义模板引擎。文章还涵盖提示词工程的最佳实践与令牌机制，为开发者提供完整的提示词设计解决方案。

【LLM】DeepSeekMath-V2模型

发现问题，并解决问题，批判性思维

11-29

1531

研究问题：这篇文章要解决的问题是如何在大型语言模型（LLMs）中进行自我验证的数学推理。具体来说，现有的基于最终答案奖励的强化学习方法在数学推理中存在根本局限性，因为正确答案并不能保证推理的正确性，特别是在定理证明任务中。研究难点：该问题的研究难点包括：如何在不依赖最终答案的情况下验证推理的正确性；如何在生成和验证之间建立有效的迭代改进循环；如何在没有已知解决方案的开放问题上扩展测试时计算。相关工作：该问题的研究相关工作有：OpenAI的推理模型在定量推理竞赛中取得了显著进展；DeepMind的Deep

【AI是否能替代IT从业者？】