在写爬虫中遇到的几个问题和几点收获

  1. 使用requests进行网络请求时,遇到https开头的url,可设置参数 varify=False,为了避开SSL校验什么的。
    但是会在终端提示InsecureRequestWarning,很是烦人+丑。
    这时可以在requests发出请求之前加一行requests.packages.urllib3.disable_warnings()`,亲测有效。
    (其实紧挨着 import requests 下放这一行代码也是可以的)。

  2. 当出现报错"urllib3(×.×.×) or chardet(×.×.×) doesn’t match a supported version" 的时候,不要慌
    只是提醒你的requests库需要更新重装了。 我是直接pip install requests的

  3. 写爬虫,多线程挺快的,但是协程更是快的惊人。
    最近爬取了一本4M多的小说《寻秦记》,单线程用了小400秒,多线程(4个线程)100零几秒。而协程只用了惊人的7秒多。
    (无图言D)有机会把代码粘过来,嗯…

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

young_kp

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值