爬虫
tw18761720160
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
网页编码的问题
用python 写爬虫的过程中,会遇到这样一些网页,它的html源码的编码和head中的charset的设置并不一致,用python的chardet模块进行检测会发现,结果中的‘confidence’并不是1,例如,可能是0.99. 这说明,该网页的编码可能有多种,遇到这样的情况,想要用charset的编码对网页的进行解码可能会出错。这里找到了一篇文章,对网页编码问题总结的很全面,我遇到的是声明为原创 2016-07-22 15:47:31 · 348 阅读 · 0 评论 -
python 时间模块: datetime
python 时间模块: datetime原创 2016-10-11 00:07:50 · 2358 阅读 · 0 评论 -
邮件发送代码
qq邮箱需要使用ssl连接, 其次需要对邮箱进行配置,开启pop3/smtp 和imap/smtp服务,并申请授权码用于替代登录密码。另外,端口号配置看这里。 scrapy的mail功能只有在scrapy项目中启动才有效, 单独的调用无效(这是测试结论) 一般形式(1) import smtplib from email.mim原创 2017-12-01 14:14:11 · 447 阅读 · 0 评论
分享