1.首先确定数据的位置
每个房间的数据都在id=live-list-contentbox
的ul中
2.
实现翻页和控制程序结束
selenium中通过点击就可以实现翻页,观察存在下一页和不存在下一页时候标签的变化
存在下一页时:
不存在下一页时:
具体代码如下:
```
import json import time from selenium import webdriver class DouYu(object): def __init__(self): self.start_url = 'https://www.douyu.com/directory/all' self.driver = webdriver.Chrome() self.index=1 def get_content_list(self): # 提取数据 li_list = self.driver.find_elements_by_xpath('//ul[@id="live-list-contentbox"]/li') content_list = [] for li in li_list: