爬取的是哔哩哔哩上所有纪录片的信息(名称,评分,描述,链接)、高分纪录片和低分纪录片的信息、以及高分纪录片的outline和点评文章。爬取深度为4,具体功能看下面描述。
一、系统功能描述
待爬种子url=“https://www.bilibili.com/”。
功能描述:通过对给定的url(哔哩哔哩首页网址)发送请求,解析出首页导航栏中“纪录片”所对应的url_2

对url_2发送请求,在url_2对应的网页中,爬取“纪录片热播榜(该网页上的前七个)”“厂牌推荐”“本周精选”“更多推荐”四大板块的纪录片的信息(名字,评分,描述,链接),保存该信息到本地文件中。
