from gevent import monkey
# monkey.patch_all()
import gevent
from urllib.request import urlopen
def f(url):
print('GET:%s' % url)
resp = urlopen(url)
data = resp.read()
# with open('ue2.htm','wb') as f:
# f.write(data)
print('%d bytes received from %s.' % (len(data),url))
# http://tcweb.mytongche.com
gevent.joinall([
gevent.spawn(f,'https://www.baidu.com'),
gevent.spawn(f,'https://www.qq.com'),
gevent.spawn(f,'https://www.csdn.com')
])
# f('http://uyi2.com/team')

本文介绍了一个利用Python的gevent库实现的简单并发网页爬取程序。通过使用协程,该程序能够同时从多个网站(如百度、腾讯、优快云)获取数据,显著提高了网页抓取的效率。
4807

被折叠的 条评论
为什么被折叠?



