三国演义人名爬取与处理
对三国演义比较感兴趣,加上正在学习爬虫,准备对三国演义人物名称进行抓取。用到的Python包如下:
bs4,用来对网页内容进行解析和相关标签内容提取
requests,请求网络
pandas,对网页表格读取和保存
首先,访问网页并对其内容进行解析。在这步中,可能由于网络不能正常访问相应网站出现相应错误,所以需要提前规避。
name_url = "https://zh.wikipedia.org/zh-cn/三国演义角色列表"
try:
url_get = reque
原创
2022-03-04 08:28:04 ·
526 阅读 ·
0 评论