java jsoup解析html 如何替换&nbsp,如何使用jsoup解析HTML表?

我试图使用jsoup解析HTML.这是我第一次使用jsoup,我也阅读了一些教程.下面是我试图解析的HTML表格 -

如果你看到我的下表,它tr现在有三个(为了理解目的,我将它缩短为有三个表行,但一般情况下会更多).现在我想Cluster Name从我的下表中提取并且它是相应的host name,例如 - 我将提取Titan为集群名称及其状态为down的所有主机名.

正如你可以看到下面的Titan群集名称,我有两个主机名machineA.abc.com和machineB.abc.com其machineA地位up,但machineB地位down.

因此,我将打印Titan为群集名称,并打印出machineB.abc.com主机名,因为它已关闭.这可以用jsoup吗?

  AlertCluster NameIP addrHost NameTypeStatusFreeVersionRestart TimeUpTime(Days)Last probedLast up
HistVI&nbspTitan10.100.111.77machineA.abc.comup88%2.0.5-SNAPSHOT2014-07-04 01:49:08,22038107-14 20:01:5907-14 20:01:59
HistVI&nbsp10.200.192.99machineB.abc.comdown85%2.0.5-SNAPSHOT2014-07-04 01:52:20,61310307-14 20:01:5907-14 20:01:59

到目前为止,我能够使用jsoup提取整个HTML表格,但不确定如何提取集群名称和下载的主机名 -

URL url = new URL("url_name");

Document doc = Jsoup.parse(url, 3000);

更新: -

我可能在表中有两个群集名称,如下所示 -

  AlertCluster NameIP addrHost NameTypeStatusFreeVersionRestart TimeUpTime(Days)Last probedLast up
HistVI&nbspTitan10.100.111.77machineA.abc.comup88%2.0.5-SNAPSHOT2014-07-04 01:49:08,22038107-14 20:01:5907-14 20:01:59
HistVI&nbsp10.200.192.99machineB.abc.comdown85%2.0.5-SNAPSHOT2014-07-04 01:52:20,61310307-14 20:01:5907-14 20:01:59
HistVI&nbspGoldy10.100.111.77machineH.pqr.comup88%2.0.5-SNAPSHOT2014-07-04 01:49:08,22038107-14 20:01:5907-14 20:01:59

现在,如果您看到上面我有两个群集名称 - 一个是,Titan而另一个是,Goldy所以我想找到所有Titan只关闭群集名称的机器.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值