SpringAI实战链接
4.SpringAI实现AI应用-使用redis持久化聊天记忆-优快云博客
5.SpringAI实现AI应用-自定义顾问(Advisor)-优快云博客
概述
想要使用SpringAI搭建知识库,就要使用SpringAI中的TikaDocumentReader,它属于ETL(提取、转换、加载)框架中的提取(Extract)阶段。
作用
TikaDocumentReader是Spring AI提供的一个文档读取器,它基于Apache Tika技术实现,能够读取并解析多种格式的文档,包括但不限于PDF、DOC/DOCX、PPT/PPTX和HTML等。这使得TikaDocumentReader成为一个非常灵活和强大的工具,适用于构建知识库或处理各种文档数据。
使用场景
TikaDocumentReader的使用场景非常广泛,包括但不限于:
构建知识库:在构建知识库时,需要从各种格式的文档中提取文本内容。TikaDocumentReader能够轻松地读取这些文档,并将其转换为统一的格式,以便后续的处理和存储。
文档处理:在处理大量文档时,如文档分类、摘要生成等任务中,TikaDocumentReader可以作为一个预处理步骤,将文档内容提取出来,为后续的处理提供便利。
数据清洗:在数据清洗过程中,有时需要从非结构化的文档中提取关键信息。TikaDocumentReader能够读取这些文档,并将其转换为结构化的数据格式,以便进行后续的数据清洗和分析。
准备工作一
在制作本地知识库的时候,还需要安装矢量数据库并下载插件vector,下载矢量化模型
矢量数据库(PostgreSQL)下载地址:EDB: Open-Source, Enterprise Postgres Database Management
插件vector下载地址:vector: Open-source vector similarity search for Postgres / PostgreSQL Extension Network
矢量化模型下载地址:text2vec-base-chinese · 模型库
遇到的问题
问题一
安装完成PostgreSQL之后,想用自带的管理器(pgAdmin4),但是报错,解决了半天没成功,直接改用navicat进行连接,但是连接的时报错(datlastsysoid does not exist),是因为Postgres 15 从pg_database表中删除了 datlastsysoid 字段引发此错误。(我安装的是PostgreSQL17)
解决方式
方法一:升级navicat
方法二:安装Postgres 15以下
方法三:修改navicat的dll文件
详述方法三:找到navicat安装的位置

找到libcc.dll文件(最好进行备份)

使用在线十六进制编辑器打开文件,在线地址:HexEd.it — 基于浏览器的十六进制编辑器

在文件中搜索“SELECT DISTINCT datlastsysoid”,并将其替换为“SELECT DISTINCT dattablespace”

最低0.47元/天 解锁文章
672

被折叠的 条评论
为什么被折叠?



