python基础,斜杠与反斜杠的区别。

探讨jieba分词库在处理Hamlet与ThreeKingdoms文本时遇到的问题,包括BOM格式utf-8文件读取及斜杠与反斜杠路径差异。分享解决方案与学习心得。

在嵩天教授的jieba库之hamlet与threekingdoms词频统计实例中,遇到了以下两个问题:

1.无法读取带有BOM的utf-8 txt文件(指threekingdom实例)

2.读取文件时斜杠与反斜杠的效果不同(hamlet实例中用反斜杠"\", threekingdom实例中用斜杠"/")

解决问题:

1.有网友提出同codecs库转化格式,但是自己不会安装codecs库,于是我在文本工具中将“带有BOM的utf-8"文件另存为”utf-8"文件以后,认为没问题了,但是还是出现了问题,如下图:

 

2.这里我不清楚斜杠与反斜杠具体的作用,但是出现的情况是:读取英文文件hamlet使用反斜杠"\", 读取中文文件threekingdoms使用斜杠"/". 

小白一枚,希望大佬能指正。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值