python爬虫基础之urllib
urllib
urllib 是 Python 标准库中用于网络请求的库。该库有四个模块,分别是urllib.request,urllib.error,urllib.parse,urllib.robotparser。
获取网页源码:urllib.request.urlopen(url)
数据需要字符串类型:decode('utf-8')
数据需要bytes类型:encode('utf-8')
网址拼接参数有汉字的,对汉字进行转义:urllib.parse.quote(url,safe=stri
原创
2020-11-26 22:47:08 ·
296 阅读 ·
1 评论