放弃折腾,AutoRAG一键锁定最佳RAG技术栈!

AutoRAG: RAG AutoML工具可自动为你的数据找到最佳RAG Pipeline。

img

市面上有许多RAG Pipeline和模块,但不知道哪种Pipeline最适合“你自己的数据”和“你自己的用例”。制作和评估所有 RAG 模块非常耗时且难以完成。

AutoRAG 支持一种简单的方法来评估许多RAG模块组合。可以使用自己的评估数据自动评估各种 RAG 模块,并找到最适合自己用例的 RAG Pipeline。

AutoRAG支持的RAG技术栈

支持16种解析模块、10种切块模块

解析模块:PDFMiner,PDFPlumber,PyPDFium2,PyPDF,PyMuPDF,UnstructuredPDF,NaverClovaOCR,llama Parse,Upstage Document Parser,Directory,Unstructured,csv,json,unstructuredmarkdown,bshtml,unstructuredxml
切块模块:Token,SentenceTransformersToken,Character,RecursiveCharacter,Sentence,Konlpy ,Semantic_llama_index,SemanticDoubleMerging,SentenceWindow,SimpleFile

img

img

img

支持40种检索、排序、生成模块

重排:UPR,Tart,MonoT5,Cohere reranker,RankGPT,Jina Reranker,Sentence Transformer Reranker,Colbert Reranker,Flag Embedding Reranker,Flag Embedding LLM Reranker,Time Reranker,OpenVINO Reranker,VoyageAI Reranker,MixedBread AI Reranker,,,Ko-reranker,,,pass_reranker
Query理解:query_decompose,hyde,multi_query_expansion,pass_query_expansion
检索:bm25,vectordb,hybrid_rrf,hybrid_cc

img

img在这里插入图片描述

支持15种评价指标

Precision,Recall,F1,MRR (Mean Reciprocal Rank),MAP (Mean Average Precision),NDCG (Normalized Discounted Cumulative Gain),Token Precision,Token Recall,Token F1,BLEU,ROUGE,METEOR,Sem Score,G-Eval,Bert Score

img

在这里插入图片描述

*数据创建*

RAG优化需要两种类型的数据:QA 数据集Corpus 数据集

  • QA数据集文件 (qa.parquet)
  • 语料库数据集文件(corpus.parquet)

QA数据集对于准确可靠的评估和优化非常重要。

语料库数据集对于 RAG 的性能至关重要。这是因为 RAG 使用语料库来检索文档并使用它生成答案。

img

*RAG优化步骤*

img

AutoRAG 如何优化 RAG 管道?

Set YAML File ->Run Evaluation -> ing -> Evaluation Done -> Best RAG Pipeline -> Deploy

imgimgimgimgimgimg

img

https://github.com/Marker-Inc-Korea/AutoRAG
https://arxiv.org/pdf/2410.20878
AutoRAG: Automated Framework for optimization of Retrieval Augmented Generation Pipeline

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值