问题截图

分析
需要解码的文件中包含ascii字符集之外的字符,因此无法正确解析
解决
增加encoding属性,并找到一种包含文件所有字符的编码集,
我经过多次尝试,发现了latin1这个宝藏字符集555555
training_data, validation_data, test_data = pickle.load(f, encoding='latin1')
latin1介绍
别名ISO-8859-1,单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号。

博客内容涉及在处理包含非ASCII字符的pickle文件时遇到的问题及其解决方案。作者发现使用latin1(ISO-8859-1)编码可以成功解析文件,latin1是一种单字节编码,兼容ASCII并覆盖了更多的字符范围。通过调整pickle.load的encoding参数为'latin1',成功加载了包含特殊字符的数据集。
2674

被折叠的 条评论
为什么被折叠?



