HuggingFists-低代码玩转LLM-腾讯云RAG(1)

本文介绍了如何在HuggingFists中使用腾讯云的技术栈(包括混元大模型和向量库)替代原有方案,搭建RAG实验,并讨论了不同技术路线对效果的影响,特别提到数据排序问题和Rerank的概念以降低大模型的token用量.

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前序

        在之前的系列文章里,笔者介绍了如何使用阿里的千问LLM、阿里的文本嵌入模型以及Milvus向量库来搭建一个RAG(检索增强生成)的实验。可通过以下的文章链接回顾一下之前介绍的内容:

HuggingFists-低代码玩转LLM RAG-准备篇

HuggingFists-低代码玩转LLMRAG(1) Embedding

HuggingFists-低代码玩转LLM RAG(2) --Query

        在之前的实验中,我们的环境里用到了Milvus向量库,关于这个向量库的搭建对很多人来说也显得有些繁琐。所以,本次我们选择使用腾讯云的向量库来代替Milvus向量库,完RAG应用场景的搭建。除了向量库采用腾讯云以外,我们本次也将文本Embedding以及大语言模型都换成腾讯云的技术栈,大模型使用腾讯云的混元大模型。在搭建这个实验的过程中,我们能够看到不同技术路线带来的效果差异。

(注:喜欢看视频的朋友可以看视频了解搭建过程《玩转数据之低代码LLM 腾讯云RAG》)

环境准备

        在腾讯云网站注册申请账号,并申请开通混元大语言模型以及腾讯向量库的应用授权,这些授权的申请需要网站审批,当申请通过后,在对应的页面创建Access Token后,就可以在HuggingFists中进行后续的环境准备工作了。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值