最近刚刚了解了一些 xpath 内容,在拜读同事写的脚本时被一处split卡住,于是查了查,知道了一些以前不太知道的东西。
基本格式:StringObj.Split(Separator,limit)
其中StringObj是分割的对象,比如说xpath路径html/body/main/article[14]/div/table/tbody/tr/td[1]/a;
Separator表示以什么分割;
limit限制分割后为几个字符串,是一个数字。比如String A = "a|b|c|d" A.Split("\\|",2) 那么分割结果为a bcd
String newxpath = xpathstr.split("tr")[0]+"tr[1]"+xpathstr.split("tr")[1];
html/body/main/article[14]/div/table/tbody/tr/td[1]/a经过这样的分割那么就变为html/body/main/article[14]/div/table/tbody/tr[1]/td[1]/a.
其实还是挺简单的呢。
本文深入探讨了XPath语法及其在网页爬虫中的应用,通过实例展示了如何使用split方法来解析和修改网页元素路径,实现对特定元素的精准抓取。
4918

被折叠的 条评论
为什么被折叠?



