“ ”在 html 里是空格占位符,普通的空格在 html 里如果连续的多个可能被认为只有一个,而” ”你写几个就能占几个空格位
而当Python对HTML中的” ”进行解析转码时,会出现无法正确编码的情况。
此时在转换的时候必须一些前置动作。
string.replace(u’\xa0’, u’ ‘)
将’\xa0‘替换成u’ ‘空格,这个\xa0就是那个html中的&nbps空格
“ ”在 html 里是空格占位符,普通的空格在 html 里如果连续的多个可能被认为只有一个,而” ”你写几个就能占几个空格位
而当Python对HTML中的” ”进行解析转码时,会出现无法正确编码的情况。
此时在转换的时候必须一些前置动作。
string.replace(u’\xa0’, u’ ‘)
将’\xa0‘替换成u’ ‘空格,这个\xa0就是那个html中的&nbps空格