请求网页: https://www.tsinghua.edu.cn/news.htm/
一. 首先要获取数据,将数据暂存于 list列表
二. 将数据存储至MySQL:
1.创建连接
2.创建游标
3.传入参数,执行命令
4.数据提交(提交至MySQL)
5.关闭游标、链接
注意: 运行代码前在MySQL新建表,做到代码与数据库的3个对应:
1. 用户名、密码对应
2. 数据库名对应
3. 传入参数时的表名、表中栏位名对应
运行结果:
```源码```
import pandas as pd
import pymysql
import requests
from lxml import etree
# 请求网址
url = 'https://www.tsinghua.edu.cn/news.htm'
# 请求头
header = {
'user_agent': 'Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/40.0.2214.93 Safari/537.36'
}
# 获取响应
response &#