关于url链接包含中文编码问题
有的网址进行数据爬取时需要对地址栏中文进行处理,比如(汽车之家, 爱卡汽车), 有的不需要处理(如百度知道),同时网站采取的编码方式不一样,也要注意编码的格式(utf-8, gbk), 处理后的结果是不一样的import urllibkeyword = '奥迪'kwd = urllib.parse.quote(keyword, encoding='utf-8', errors='repl...
原创
2018-08-28 16:09:33 ·
4444 阅读 ·
0 评论