项目名称:AI-AGENT夏季训练营 — RAG智能对话机器人
报告日期:2024年8月18日
项目负责人:shark688
项目概述:
随着金融市场的日益复杂化和信息量的爆炸性增长,投资者、分析师及企业管理人员在快速准确地获取并理解上市公司年报中的关键信息时面临巨大挑战。传统的手工查阅和数据分析方式不仅效率低下,而且容易遗漏重要细节或误解数据背后的含义。因此,开发一款高效、智能的金融年报问答助手成为市场迫切需求。
该Rag智能对话机器人能允许用户可通过自然语言提问,能准确理解问题意图,并从海量年报数据中快速检索、整合相关信息,给出准确、简洁的答案。支持复杂查询,如跨年度对比、行业趋势分析等。
技术方案与实施步骤
- 模型选择: 优先选择NVDIA官网中较好的大模型以及向量模型(也可以选择OpenAI),好的向量模型创建出的向量库更加精确,能够为大模型提供更好的文档检索。 RAG模型能够增强大模型功能,使得大模型基于本地知识库来返回对应的答案。
- 数据的构建:
- 使用pdfplumber对PDF进行处理,提取出PDF中的文本以及表格
- 将上一步提取出的文本使用LangChain的textspliter来对文本进行处理,分割成块
- 将分割成的块提交给NVDIA向量模型,基于返回数据创建向量库