一、在代码的开头(import语句之前)添加
# coding:utf-8
这样就可在代码及注释中包含中文了,并且输出也可以是中文
二、如果是通过代理上网,那么就需要按如下方式添加代理的IP及端口号
list_url = "http://www.baidu.com"
proxies = {
"http":"http://109.105.1.52:8080",
}
r = requests.get(list_url,proxies=proxies)
如果是通过.pac文件上网,需要获取.pac文件的内容然后找到其中的代理服务器IP和端口填写至上述代码的响应位置。
附:讲解HTTP协议代理的一篇很好的文章http://www.cnblogs.com/TankXiao/archive/2012/12/12/2794160.html
本文介绍如何在Python爬虫代码中设置正确的字符编码(如utf-8),以便能够在代码和注释中使用中文,并确保输出结果也是中文。此外,还详细说明了如何配置HTTP代理,包括直接指定IP和端口的方式以及通过.pac文件获取代理信息的方法。
2万+

被折叠的 条评论
为什么被折叠?



