- 博客(3)
- 资源 (3)
- 收藏
- 关注
原创 网页 Print To PDF 生成的 PDF 文本无法读取问题
摘要:在处理PDF文件时发现文字无法选中,检查发现是通过虚拟打印机生成的矢量图形。解决方法是对PDF进行OCR识别(如使用pdf2image+pytesseract),或直接选择"另存为PDF"而非虚拟打印。这解决了RAG技术处理特殊PDF时遇到的文字提取问题。
2025-08-04 11:44:51
557
原创 Chroma 匿名收集使用信息引发的异常
摘要:在使用Chroma.from_documents加载向量数据库时遇到SSLError,发现是Chroma默认启用匿名数据收集功能导致。临时解决方案是关闭防火墙,但长期解决方案是通过设置环境变量ANONYMIZED_TELEMETRY=false来禁用该功能。参考Chroma官方文档确认了该问题的根源及解决方法。(99字)
2025-07-29 22:02:28
708
PMP强化记忆手册(PMBOK2008版).xls
2010-01-19
Coldfusion函数
2010-01-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅