由于Weka的默认字符集编码是CP1252,所以如果导入的数据文件中包含中文字符,就会出现乱码的情况。
解决办法是:在Weka的安装目录下找到RunWeka.ini文件,找到fileEncoding一行,将Cp1252修改为UTF-8,这样就能正常显示中文了。
若仍有问题,则改为GB2312.
本文介绍了解决Weka处理中文数据时出现乱码的方法。通过修改Weka安装目录下的RunWeka.ini文件中的字符编码设置,可以实现对中文字符的正确显示。首先尝试将编码设置为UTF-8,如仍有问题再改为GB2312。
由于Weka的默认字符集编码是CP1252,所以如果导入的数据文件中包含中文字符,就会出现乱码的情况。
解决办法是:在Weka的安装目录下找到RunWeka.ini文件,找到fileEncoding一行,将Cp1252修改为UTF-8,这样就能正常显示中文了。
若仍有问题,则改为GB2312.
1916

被折叠的 条评论
为什么被折叠?