
RAG
文章平均质量分 65
需要重新演唱
这个作者很懒,什么都没留下…
展开
-
检索-重新排序-生成(Retrieve-Rerank-Generate, R2G)
R2G 方法的核心思想是通过结合多种检索方法的结果,并对其进行重新排序,从而优化检索结果的质量。这种方法通过增强检索结果的鲁棒性,为生成模型提供了更高质量的输入,进而提高了生成结果的准确性和相关性。原创 2024-07-24 10:55:23 · 491 阅读 · 0 评论 -
查询增强(Query Enhancement)
查询增强方法的核心思想是通过组合原始查询和初步生成的输出,生成一个更丰富和更具信息量的新查询。这个新查询包含了原始查询的意图以及初步生成的输出的相关信息,从而帮助检索系统更好地理解用户的检索需求,并找到更相关的文档。原创 2024-07-24 10:49:39 · 488 阅读 · 0 评论 -
查询重写(Query Rewriting)
查询重写方法的核心思想是通过重新表述原始查询,使其更符合检索系统的理解和处理方式。这通常涉及使用大型语言模型(LLMs)或其他生成模型来生成新的查询,这些新查询包含了更明确和具体的检索需求。原创 2024-07-24 10:47:27 · 840 阅读 · 0 评论 -
HyDE(Hypothetical Document Embeddings)
HyDE 方法的核心思想是通过生成与查询相关的假设文档来扩展查询的语义信息。这些假设文档被视为查询的“假设性答案”,它们包含了与查询相关的潜在信息,可以帮助检索系统更好地理解查询的意图,并找到更相关的文档。原创 2024-07-24 10:43:47 · 701 阅读 · 0 评论 -
使用单编码器进行检索器的预训练
通过上述步骤,单编码器检索器可以在大规模未对齐的文档上进行有效的预训练,从而学习到有用的语义表示,用于后续的检索任务。原创 2024-07-24 10:33:14 · 224 阅读 · 0 评论 -
TF-IDF和BM25
TF-IDF和BM25都是评估词在文档中重要性的有效方法,但BM25通过引入更多的参数和考虑文档长度等因素,通常能提供更精确的权重计算。在实际应用中,选择哪种算法取决于具体的应用场景和需求。原创 2024-07-24 10:20:32 · 605 阅读 · 0 评论 -
RAG中的全文检索
全文检索(Full-Text Search)是一种在大量文本数据中查找信息的高效技术。原创 2024-07-15 10:53:04 · 709 阅读 · 0 评论