此次爬取网址:https://www.douyu.com/g_DNF
爬取内容:主播名字,主播热度
由于有两个相同的DyListCover_info信息,所以选取了DyListCover-hot这一行
作为正则的前缀界定
正则:
在爬取时内容时,发现爬取内容为空,于是我扩大了正则范围
然后将爬取的数据打印一条出来
发现<span class="DyListCover-hot"这多了个is-template.
在上面的正则上加上is-template就能成功爬取到数据了。
不是很懂web,希望大佬指教一下。