java通过正则表达式提取XML节点内容

本文介绍了一种使用Java正则表达式从HTML字符串中提取特定标签内容的方法。通过实例演示了如何匹配并获取<doc>与<title>等标签内的文本信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

现在有类似<doc>abc</doc><title>3232</title> <doc>只要内容</doc>这么一个串,需要提取abc,3232,只要内容的节点内容

[java]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. public static List getContext(String html) {  
  2.         List resultList = new ArrayList();  
  3.         Pattern p = Pattern.compile(">([^</]+)</");//正则表达式 commend by danielinbiti  
  4.         Matcher m = p.matcher(html );//  
  5.         while (m.find()) {  
  6.             resultList.add(m.group(1));//  
  7.         }  
  8.         return resultList;  
  9.     }  
  10.     /** 
  11.      * @param args 
  12.      */  
  13.     public static void main(String[] args) {  
  14.         String a = "<doc>abc</doc><title>3232</title> <doc>只要内容</doc>";  
  15.         List list = getContext(a);  
  16.         System.out.println(list);  
  17.     }  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值