
Python
文章平均质量分 71
82年的辣鸡
这个作者很懒,什么都没留下…
展开
-
Python3 基础爬虫
1. requests在Python3中,可以使用urllib.request和requests进行网页爬取。urllib库是python内置的,无需安装requests库是第三方库,需自行安装1.1 安装命令pip install requests1.2 requests的基础方法方法说明requests.request()构造一个请求,支撑以下方法的基础方法requests.get()获取HTML网页,对应HTTP的GETrequests.head原创 2021-08-21 11:59:46 · 1160 阅读 · 0 评论 -
Python 爬虫的合法性 - robots.txt
1. 爬虫的合法性 - robots.txt网站都有一个名为 robots.txt 的文档,当然也有部分网站没有设定 robots.txt。robot.txt是网站写给爬虫看的,里面写了不希望爬虫做的事,如不要访问某些文件夹或文件,或限制爬虫访问网站的频率对于没有设定 robots.txt 的网站可以通过网络爬虫获取没有口令加密的数据,也就是该网站所有页面数据都可以爬取。如果网站有 robots.txt 文档,就要判断这个网站有哪些数据是不能去爬取的1.1 查看robot.txt根域名/robo原创 2021-08-21 00:47:36 · 1778 阅读 · 1 评论 -
Python SMTP邮件发送详解
一、前言SMTP是发送邮件的协议,Python内置对SMTP的支持,可以发送纯文本邮件、HTML邮件以及带附件的邮件。Python对SMTP支持有smtplib和email两个模块email构造邮件smtplib发送邮件二、模块安装1. smtplibsmtplib不能直接使用pip install smtplib通常发送邮件用PyEmail,所以直接pip install PyEmail就行 PyEmail (0.0.1) - Python library原创 2021-08-02 00:46:32 · 2080 阅读 · 1 评论