java 正则表达式获取指定两个字符串之间内容

介绍一种使用正则表达式从复杂XML中提取特定内容的方法,并提供Java实现示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

xml解析利用正则表达式获取指定两个字符串之间内容

                      在遇到解析复杂xml的时候,想到大家所想到的都是利用dom4j作为首发工具,但是当遇到层次很多,较为复杂,我们难道还需要从根节点一层一层的解析下去吗?此时不仅代码繁琐,而且准确率还不是那么高,采用此种方式,可以获取指定两种字符串之间的任意xml文本。
package com.starit.analyse.util;

import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class DealStrSub {
    /**
     * 正则表达式匹配两个指定字符串中间的内容
     * @param soap
     * @return
     */
    public static List<String> getSubUtil(String soap,String rgex){
        List<String> list = new ArrayList<String>();
        Pattern pattern = Pattern.compile(rgex);// 匹配的模式
        Matcher m = pattern.matcher(soap);
        while (m.find()) {
            int i = 1;
            list.add(m.group(i));
            i++;
        }
        return list;
    }
    
    /**
     * 返回单个字符串,若匹配到多个的话就返回第一个,方法与getSubUtil一样
     * @param soap
     * @param rgex
     * @return
     */
    public static String getSubUtilSimple(String soap,String rgex){
        Pattern pattern = Pattern.compile(rgex);// 匹配的模式
        Matcher m = pattern.matcher(soap);
        while(m.find()){
            return m.group(1);
        }
        return "";
    }
    
    /**
     * 测试
     * @param args
     */
    public static void main(String[] args) {
        String str = "abc3443abcfgjhgabcgfjabc";
        String rgex = "abc(.*?)abc";
        System.out.println(getSubUtil(str,rgex));
        System.out.println(getSubUtilSimple(str, rgex));
    }  
}


若给出的正则表达式rgex匹配不到的话,就会返回空,这两个方法运用得当,解析复杂的xml就迎刃而解了。

运行结果如下:




Java 正则表达式中,如果需要匹配两个字符串中的任意一个,可以使用正则表达式的“或”逻辑操作符 `|` 来实现。该符号允许在多个模式之间进行选择,只要其中一个模式匹配即可。 ### 使用方式 假设需要匹配的两个字符串分别为 `"apple"` 和 `"banana"`,可以将正则表达式写为: ```java String pattern = "apple|banana"; ``` 此正则表达式会匹配包含 `"apple"` 或 `"banana"` 的字符串。 ### 示例代码 以下是一个完整的示例代码片段,演示如何使用正则表达式来匹配任意一个字符串: ```java import java.util.regex.Matcher; import java.util.regex.Pattern; public class Main { public static void main(String[] args) { String content = "I like apple and banana."; String patternString = "apple|banana"; Pattern pattern = Pattern.compile(patternString); Matcher matcher = pattern.matcher(content); while (matcher.find()) { System.out.println("匹配到的内容: " + matcher.group()); } } } ``` 输出结果: ``` 匹配到的内容: apple 匹配到的内容: banana ``` ### 匹配固定格式的字符串 如果需要匹配特定格式的字符串(例如固定长度的电话号码、关键字等),可以通过组合其他正则表达式语法来增强匹配能力。例如,要匹配以 `"start"` 开头并以 `"end"` 结尾的任意内容,可以编写如下正则表达式: ```java String pattern = "start.*end"; ``` 这里 `.*` 表示匹配任意字符(包括空格和特殊字符)零次或多次 [^3]。 ### 相关问题 如果需要更复杂的匹配规则,比如忽略大小写或者匹配整个单词,可以结合正则表达式标志位 `Pattern.CASE_INSENSITIVE` 或 `\b` 单词边界来扩展匹配功能。
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值