selenium html table,在Selenium解析一张 table

最新推荐文章于 2024-05-14 16:45:48 发布

福桃九分饱

最新推荐文章于 2024-05-14 16:45:48 发布

阅读量341

点赞数

文章标签： selenium html table

博主正在尝试利用Selenium/Python从HTML表格中提取电视频道信息。由于表格没有唯一标识符，他们通过链接文本选择行，并希望迭代相邻元素获取更多信息（如编码格式、频道编号等）。然而，他们遇到了困难，`next_sibling()`方法不可用，且尝试使用XPath的`following-sibling`轴也未成功找到所需元素。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我正在尝试使用Selenium / Python来读取基本的HTML表 . 每行的格式如下：

TV Polri

MPEG-4 16 66 142 In new

该表不包含要锁定的ID或类，因此我使用href的内容选择行(与电视 Channels 相关)：

text = "https:www.lyngsat.com/tvchannels/"

for elem in driver.find_elements_by_xpath('//a[contains(@href,"%s")]' % text):

print(elem.text) # Prints TV Polri, the name of the TV channel

我现在想迭代兄弟元素以拉出行中的其他信息(例如“MPEG-4”，“16”，“66”，“142 In”，“New”) . 如果我可以通过以下方式移动到下一个兄弟，这将是最简单的：

channel_elem = elem.nextsibling()

...但是这个功能似乎不存在 . 我也尝试使用'follow-sibling'直接找到其他兄弟姐妹：

for channel_elem in driver.find_elements_by_xpath('//td//a[contains(@href,"%s")]/../../following-sibling::td' % text):

# Read 2nd sibling (Channel)

但是这没有找到任何元素，也感觉像是一个迂回的解决方案 .

在此先感谢所有的帮助 .

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。