java代码安全检查工具_Java文件解析工具箱设计,快速文件编码的安全性检查

博主正在开发一款Java ETL工具,该工具能够处理多种格式的数据文件,并且支持自定义处理阶段。目前遇到了文件编码识别的问题,计划采用Apache Commons IO库进行文件读写,并考虑统一输出文件编码为UTF-16。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(免责声明:我在询问之前看了这里的一些帖子,我发现

this one

特别有帮助的是,我只是想从你们那里得到一点理智的检查,如果可能的话)

大家好,

我有一个内置Java产品,用于处理加载到数据库中的数据文件(又名ETL工具)。我已经为xslt转换预先准备了阶段,并在原始文件中执行模式替换之类的操作。输入文件可以是任何格式,它们可以是平面数据文件或XML数据文件,您可以配置加载特定数据源所需的阶段。

到目前为止,我忽略了文件编码的问题(我知道这是个错误),因为一切都很好(基本上)。然而,我现在要面对文件编码问题,为了长时间的短故事,因为阶段的性质可以被配置在一起,我需要检测输入文件的文件编码,并用适当的参数创建一个Java读取器对象。我只是想和你们做一个快速的精神检查,在我陷入一些我不能完全理解的事情之前:

对工具箱中每个阶段输出的所有文件采用标准的utf-16文件编码(我不排除将来加载双字节字符的可能性)

使用ApacheCommonsIO库为所有阶段创建一个标准的读写器(我是否认为这没有类似的编码嗅探API?)

你认为我的方法有什么不足之处吗?

有没有任何方法可以让我相信,通过使用我现有的方法让Java运行时决定Windows 1252的编码来加载任何数据的向后兼容性?

提前谢谢你,

-杰姆斯

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值