- 博客(4)
- 收藏
- 关注
原创 给自己用的,别看
Anaconda官网:https://www.anaconda.com/ Anaconda-Linux下载链接:https://repo.anaconda.com/archive/Anaconda3-2023.07-2-Linux-x86_64.sh。
2025-03-13 12:48:29
61
原创 langchain0.3.1版本中,知识库doc,docx,pdf转md格式(实测md格式最佳)
docx,pdf转md格式(pdf格式在pdf,csv,md三种格式下测试,md格式效果远好于另外两种)doc转docx,0.3.1版本的不支持doc上传。
2025-03-11 12:56:48
106
原创 langchain0.3.1版本对doc文件解析上传失败的解决方案
5.修改libs/chatchat-server/chatchat/server/knowledge_base/utils.py,把几个 [".docx"], 改成[".doc",".docx"]就好了(代码过长不放上来了)2.在库中的libs/chatchat-server/chatchat/server/file_rag/document_loaders文件夹下建立convertfile.py。4.修改mydocloader.py,先转换文件格式再解析上传。3.在init.py增加。
2025-03-10 14:07:24
193
原创 langchain0.3.1版本中关于pdf上传失败及pdf中对图片OCR效果差的解决方法。
1.普通PDF文件无法正常向量化问题: 解决:直接参考链接:https://github.com/chatchat-space/Langchain-Chatchat/issues/4787 https://blog.youkuaiyun.com/lu_rong_qq/article/details/143409795?spm=1001.2014.3001.5506 这两个一起参考,肯定能解决。
2025-03-05 15:21:35
165
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人