机器学习在数据处理方面可能会遇到-CSV数据打开乱码的问题,其实是csv格式特有的原因:
按照以下的教程,将会解决乱码的问题:
方法1:
安装一个Editplus文本编辑器,文本读取的神器,一般默认格式是UTF-8格式;
优点:(1) 可以自动的进行文本的统计和标记、文本中选中的内容在整个文档中自动标记比较明显的颜色;
缺点: 对应的列没有对齐,看起来不是很方便;
方法2:
csv格式 使用excel打开能够对齐显示、用使用统计等工具,但是可能出现乱码;
1)右键新建一个excel;
2)第一步
3
3)第二步
4)创建新的空白工作簿之后
进入数据“”菜单栏“”——》选择“”自文本“”——》选择要打开的xx.csv文件,
5)选择csv文件
6)自动弹出格式选择, 默认就行了
7)点击“”下一步“”,进入下一个设置页面,选择逗号“””分隔符“; 选择后 进入下一步;
8)选择“”文本“”, 选择后点击“”完成“”
搞定~~~~~