
RAG
文章平均质量分 96
嘉羽很烦
慢慢慢慢,凡事平常心
展开
-
开源的 LLM 应用开发平台-Dify 部署和使用
官网生成式 AI 应用创新引擎开源的 LLM 应用开发平台Dify 为开发者提供了健全的应用模版和编排框架,你可以基于它们快速构建大型语言模型驱动的生成式 AI 应用,将创意变为现实,也可以随时按需无缝扩展,驱动业务增长。原创 2025-02-20 01:49:38 · 2652 阅读 · 0 评论 -
向量库(Vector Database)
通过此大纲,您可以从理论到实践全面掌握向量库的核心知识,并选择合适的工具与算法解决实际问题。原创 2025-02-18 22:23:15 · 953 阅读 · 0 评论 -
大模型系列——解读RAG
一个很好的老选择是有一个交叉编码器。它的工作原理是把查询和每个最高k个检索到的文本块传递给交叉编码器,用一个标记分隔,然后对它进行微调,相关的块输出为1,不相关的块输出为0。数据块的大小是一个需要考虑的参数,它取决于使用的嵌入模型及其token容量,标准的transformer编码模型,如BERT 的句子转换器,最多只能使用512个token,OpenAI ada-002能够处理更长的序列,如8191个token,但这里的折衷是足够的上下文,让 LLM 能够推理以及特定的足够文本嵌入,以便有效地执行搜索。转载 2025-02-16 03:35:06 · 52 阅读 · 0 评论