编码问题导致weka不识别ARFF文件

博主尝试使用Weka处理ARFF格式文件时遇到问题,文件无法被正确识别。即使文件首行为@relation,仍提示格式错误。经排查发现,编码格式选择不当导致问题出现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

想用weka处理一个文件,文件格式已经转为ARFF,可总是报错,如下图所示。



 警告框说not recognised as an 'Arff data files' file.

原因 Unable to determine structure as arff (keyword @relation expected)

 

可是,文件明明是ARFF格式的,文件第一行确实是@relation

 

苦思不得其解……

 

将文件中内容复制重存一份,发现弹出如下对话框。


 

该文件含有Unicode格式的字符,当文件保存为ANSI编码的文本文件时,该字符将丢失。

当时,我选择了取消,并将文件保存成Unicode编码的格式。

于是,weka就不识别ARFF文件了。

 

同时,测试了另外几种编码方式:Unicode、Unicode big endian、utf-8,均不能被weka识别。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值