我试图使用jsoup解析HTML.这是我第一次使用jsoup,我也阅读了一些教程.下面是我试图解析的HTML表格 -
如果你看到我的下表,它tr现在有三个(为了理解目的,我将它缩短为有三个表行,但一般情况下会更多).现在我想Cluster Name从我的下表中提取并且它是相应的host name,例如 - 我将提取Titan为集群名称及其状态为down的所有主机名.
正如你可以看到下面的Titan群集名称,我有两个主机名machineA.abc.com和machineB.abc.com其machineA地位up,但machineB地位down.
因此,我将打印Titan为群集名称,并打印出machineB.abc.com主机名,因为它已关闭.这可以用jsoup吗?
Alert | Cluster Name | IP addr | Host Name | Type | Status | Free | Version | Restart Time | UpTime(Days) | Last probed | Last up | ||
Hist | VI |   | Titan | 10.100.111.77 | machineA.abc.com | up | 88% | 2.0.5-SNAPSHOT | 2014-07-04 01:49:08,220 | 381 | 07-14 20:01:59 | 07-14 20:01:59 | |
Hist | VI |   | 10.200.192.99 | machineB.abc.com | down | 85% | 2.0.5-SNAPSHOT | 2014-07-04 01:52:20,613 | 103 | 07-14 20:01:59 | 07-14 20:01:59 |
到目前为止,我能够使用jsoup提取整个HTML表格,但不确定如何提取集群名称和下载的主机名 -
URL url = new URL("url_name");
Document doc = Jsoup.parse(url, 3000);
更新: -
我可能在表中有两个群集名称,如下所示 -
Alert | Cluster Name | IP addr | Host Name | Type | Status | Free | Version | Restart Time | UpTime(Days) | Last probed | Last up | ||
Hist | VI |   | Titan | 10.100.111.77 | machineA.abc.com | up | 88% | 2.0.5-SNAPSHOT | 2014-07-04 01:49:08,220 | 381 | 07-14 20:01:59 | 07-14 20:01:59 | |
Hist | VI |   | 10.200.192.99 | machineB.abc.com | down | 85% | 2.0.5-SNAPSHOT | 2014-07-04 01:52:20,613 | 103 | 07-14 20:01:59 | 07-14 20:01:59 | ||
Hist | VI |   | Goldy | 10.100.111.77 | machineH.pqr.com | up | 88% | 2.0.5-SNAPSHOT | 2014-07-04 01:49:08,220 | 381 | 07-14 20:01:59 | 07-14 20:01:59 |
现在,如果您看到上面我有两个群集名称 - 一个是,Titan而另一个是,Goldy所以我想找到所有Titan只关闭群集名称的机器.