在Dify v1.10.1版本中,知识库流水线中已经有了minerU的工作流,具体集成方法如下:
首先,在知识库流水线中引入这个工作流:


其次,设置minerU 的API Key授权。

其它的参数按默认设置即可,然后就可以使用了。
特别注意:需要在.env中设置 FILES_URL=http://api:5001,以便可以上传文件。
以上过程只是解析了含图表、图片、表格的pdf,存储知识还需要在后续流程中增加处理,若表格比较大,建议使用使用比如默认1024更长的分片。
在Dify v1.10.1版本中,知识库流水线中已经有了minerU的工作流,具体集成方法如下:
首先,在知识库流水线中引入这个工作流:


其次,设置minerU 的API Key授权。

其它的参数按默认设置即可,然后就可以使用了。
特别注意:需要在.env中设置 FILES_URL=http://api:5001,以便可以上传文件。
以上过程只是解析了含图表、图片、表格的pdf,存储知识还需要在后续流程中增加处理,若表格比较大,建议使用使用比如默认1024更长的分片。
2554

被折叠的 条评论
为什么被折叠?