自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 FastGPT中文文件名上传乱码——python代码

【摘要】本文针对FastGPT中文文件名上传乱码问题提出解决方案。关键发现服务端需URL编码(Percent-encoding)而非RFC2231或UTF-8原始字节。通过Python的quote_plus()模拟Java URLEncoder,结合requests自动处理文件句柄,完美匹配服务端预期。方案包含重试机制、完整响应日志及批量导入功能,经测试成功解决中文PDF上传乱码问题。技术亮点包括:自动编码转换、with语句确保文件安全访问、多文件批量处理及详细日志记录。

2025-11-18 11:39:27 223

原创 使用大模型提取论文关键词对应值的一些思考

本文总结了利用大模型从科学文献PDF中提取关键词和对应值的实践经验。通过PDF转文本、关键词提取和提示词优化,正确率从初始较低水平提升至95%。关键改进包括:1)采用LaTeX标准格式处理化学符号;2)优化提示词策略,增加对比表、差异表和值范围表;3)建立三级提取验证流程(生成者-评审者-仲裁者);4)使用PaddleOCR将PDF转为结构化Markdown格式。研究发现模型选择(闭源优于开源)、专业领域知识(存入向量库替代人工核对)和多次迭代验证对准确率至关重要。最终方案在不微调模型的情况下,通过格式转

2025-08-11 18:39:46 909

原创 Epub电子制作流程

Dobby制作Epub电子书流程

2025-03-17 11:56:30 2323

原创 label-studio配置postgresql(Windows10)

1.确认 Label Studio 和 PostgreSQL 安装。2.修改 Label Studio 的settings配置以使用 PostgreSQL。在Windows系统下操作

2024-11-25 17:47:19 1163 1

原创 鼠标滚轮放大缩小和拖动,点击按钮页面一分为二

鼠标滚轮放大缩小和拖动,点击按钮页面一分为二

2024-08-28 21:44:47 310

原创 使用ClassLoader.getSystemClassLoader()报java.lang.NullPointerException

使用ClassLoader.getSystemClassLoader()报java.lang.NullPointerException

2022-10-15 18:07:25 676 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除