python网络爬虫爬取官网新通知，并发送邮箱

最新推荐文章于 2025-02-16 14:12:52 发布

原创

最新推荐文章于 2025-02-16 14:12:52 发布 · 2.5k 阅读

13 ·

CC 4.0 BY-SA版权

简介
考研结束后，因为要关注官网发布的录取通知，每天都要去官网看好几遍。于是便做一个网络爬虫来自动处理事件，可以判断当天是否有最新的消息发布，如果有就发送到个人邮箱。
该爬虫主要涉及的部分有：

网页请求
网页解析
时间判断
邮件发送

网页请求
网页请求使用的是常规的requests库

    def get_response(self, url):
        print(url)
        response = requests.get(url)
        data = response.content
        return data

页面解析
首先看一下所要爬取的页面的结构：
在这里插入图片描述
首次所要爬取的目标便是官网通知的标题信息，可以通过 id='content’下的a标签来进行定位，这一部分的解析如下：

    def parse_data(self,data):
        soup = BeautifulSoup(data, 'html.parser', from_encoding='gb18030')
        all = soup.find(id="content"

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

是小明耶

关注关注

3
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Python爬虫实战：自动爬取数据并实现自动导出与邮件发送

2201_76125261的博客

05-28

764

爬虫（Web crawler或Spider）是一种自动访问网页并抓取信息的程序。它通过模拟浏览器发送HTTP请求，获取网页内容，然后解析和提取数据。建议Python版本使用3.10及以上，确保兼容最新库。bash复制编辑requests：HTTP请求：HTML解析pandas：数据处理和导出yagmail：Gmail邮件发送简化库，支持SMTP自动登录和附件发送。

python爬取天气预报并发送短信_Python3爬虫教程之利用Python实现发送天气预报邮件...

weixin_29664819的博客

02-21

3132

前言此次的目标是爬取指定城市的天气预报信息，然后再用Python发送邮件到指定的邮箱。下面话不多说了，来一起看看详细的实现过程吧一、爬取天气预报1、首先是爬取天气预报的信息，用的网站是中国天气网，网址是http://www.weather.com.cn/static/html/weather.shtml，任意选择一个城市(比如武汉)，然后要爬取的内容为下面的部分：先查看网页源代...

参与评论您还未登录，请先登录后发表或查看评论

Python 关于网站更新消息并发送邮箱通知

qq_37857921的博客

12-27

8156

Python 关于网站更新消息并发送邮箱通知： 1.目的：笔者由于需要及时收到教育厅官网推送的消息，又由于笔者需要准备应考，所以特写一个脚本来检测网站最新的发布。 2.语言：python3 开发编译器:Sublime Text3 3.设计思路：爬取网站第一条推送的数据-->与数据库预存信息进行比对-->返回值为true则调用发送邮件函数，否则继续检测。使用shell脚本进行程序循...

爬虫--爬取csdn消息并邮箱通知（python3）

程松

02-13

2706

weixin_43857152的博客

01-08

3490

爬取每天更新的新闻，使用scrapy框架，Python2.7，存入MySQL数据库，将每次的爬虫日志和爬取过程中的bug信息存为log文件下。定义bat批处理文件，添加到计划任务程序中，自动爬取。额… 1.在items文件中，定义需要爬取的类 2.在settings文件中设置默认项，设置日志输出格式，打开pipeline文件，设置delay时间，设置数据库信息，设置请求头等信息 3.编写自己...

python爬虫相关官网及文档地址

weixin_33921089的博客

01-03

344

http://scrapy-chs.readthedocs.io/zh_CN/0.24/topics/settings.html#topics-settings-ref srcpy中文文档 https://github.com/rolando/scrapy-redis...

python爬取网页公告并批量存入至mysql中

imjtrszy的专栏

07-30

1630

开发环境:python 2.7.6,mysql 5.5-44 #coding=utf-8 import urllib2 import urllib import string import re import MySQLdb req=urllib2.Request("http://jw.nju.edu.cn/") response=urllib2.urlopen(req) myPage=res

python爬虫爬取监控教务系统的思路详解

09-18

因此，本文介绍了一种使用Python爬虫技术来监控教务系统并及时获取成绩的方法。首先，我们需要了解Python爬虫的基础知识。Python爬虫是一种自动从互联网上提取数据的程序，通常用于网页数据的抓取。在本例中，...

爬虫自动定时获取查重结果并将结果发送至指定邮箱

qq_44638724的博客

05-09

697

期刊论文查重，但是查询结果较慢（1-2天），总是手动刷新网站速度很繁琐，这是爬虫技术就可以派上用场了 url http://cx.bilunwen.com/qk/checkport 商家给的查询地址很简陋，基本上淘宝商家的页面都一样，也没有任何反爬措施，我们只要在这里输入订单号就可以查询了与以往不同的是，我们通常会爬取静态网页，但这次任务中我们需要输入订单号，再点击查询报告按钮页面才会更新，才能看到查重报告是否生成。所以直接get(url)不会有任何结果思路显然我们需要分析网页，这

python爬取政府通知_python爬取网页公告并批量存入至mysql中

weixin_39615499的博客

02-21

997

开发环境:python 2.7.6,mysql 5.5-44#coding=utf-8import urllib2import urllibimport stringimport reimport MySQLdbreq=urllib2.Request("http://jw.nju.edu.cn/")response=urllib2.urlopen(req)myPage=response.read(...

利用Selenium(爬虫)爬取物流信息，并用邮件提醒自己物流更新

qq_41084438的博客

02-20

5812

受疫情影响，快递无法全面复工，商家在过年期间又压了一堆未发货的订单。现在下单一个快递，商家迟迟无法发货，就算发了货，物流也慢的跟蜗牛一样。每天就是打开淘宝看物流信息，物流信息又没更新，关淘宝，为了节省这些时间，不在焦虑中度过，写了这么一个功能。(*^__^*) 嘻嘻…… 准备工作 pip install lxml pip install selenium pip installsm...

爬虫python request 官网教程

生信小博士的博客

01-12

776

【代码】爬虫python request 官网教程。

Python - 爬虫小白入门大佬勿喷 - 爬虫辅助神器在线网址推荐