- 博客(6)
- 收藏
- 关注
原创 FastGPT中文文件名上传乱码——python代码
【摘要】本文针对FastGPT中文文件名上传乱码问题提出解决方案。关键发现服务端需URL编码(Percent-encoding)而非RFC2231或UTF-8原始字节。通过Python的quote_plus()模拟Java URLEncoder,结合requests自动处理文件句柄,完美匹配服务端预期。方案包含重试机制、完整响应日志及批量导入功能,经测试成功解决中文PDF上传乱码问题。技术亮点包括:自动编码转换、with语句确保文件安全访问、多文件批量处理及详细日志记录。
2025-11-18 11:39:27
223
原创 使用大模型提取论文关键词对应值的一些思考
本文总结了利用大模型从科学文献PDF中提取关键词和对应值的实践经验。通过PDF转文本、关键词提取和提示词优化,正确率从初始较低水平提升至95%。关键改进包括:1)采用LaTeX标准格式处理化学符号;2)优化提示词策略,增加对比表、差异表和值范围表;3)建立三级提取验证流程(生成者-评审者-仲裁者);4)使用PaddleOCR将PDF转为结构化Markdown格式。研究发现模型选择(闭源优于开源)、专业领域知识(存入向量库替代人工核对)和多次迭代验证对准确率至关重要。最终方案在不微调模型的情况下,通过格式转
2025-08-11 18:39:46
909
原创 label-studio配置postgresql(Windows10)
1.确认 Label Studio 和 PostgreSQL 安装。2.修改 Label Studio 的settings配置以使用 PostgreSQL。在Windows系统下操作
2024-11-25 17:47:19
1163
1
原创 使用ClassLoader.getSystemClassLoader()报java.lang.NullPointerException
使用ClassLoader.getSystemClassLoader()报java.lang.NullPointerException
2022-10-15 18:07:25
676
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅