用途:个人学习笔记,有所借鉴,欢迎指正
前言:
主要包含对requests库和Web爬虫解析库的使用,python爬虫自动化,批量信息收集
一、EDUSRC平台爬取接收漏洞的教育机构名称
1、爬取目标:EDUSRC平台此网页第1-209页的所有教育机构名称,保存到txt文件中
2、Python代码实现:
import requests,time
from bs4 import BeautifulSoup
#<tr>
# <td class="am-text-center">1</td>
# <td class="am-text-center">
# <a href="/list/firm/3761">上海交通大学</a>
# </td>
# <td class="am-text-center"&g