在使用 Dify 做批量运行、知识库导入、数据集上传时,很多同学经常会遇到一个 隐藏大坑 ——
上传 CSV 文件后,出现如下问题:
✅ 中文乱码
✅ 知识库索引失败 / 内容空白
✅ 批量任务运行报 UnicodeDecodeError
✅ API 调用出的数据异常
其实问题很简单:CSV 文件编码不对!
📌 背景原因
很多人在 Windows 下用 Excel 或 WPS 编辑 CSV,默认保存编码是 ANSI(GB2312 / GBK),
而 Dify(包括后台处理、API 接口、LLM 模型处理)统一要求 UTF-8 编码。
⚠️ 如果 CSV 不是 UTF-8 编码,Dify 无法正确读取,必然出问题。