java使用正则表达式将xml文本中的特定的标签替换掉

本文介绍了一个Java程序,该程序使用正则表达式从文本中移除特定的HTML标签,具体为<ul class=pre-numbering>,以避免代码块序号显示错误。通过读取源文件,查找并替换指定的HTML标签,然后将处理后的文本写入目标文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import java.io.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/*
*
* 使用正则表达式将文本中的 <ul class="pre-numbering"></ul>替换成空字符串 ,复制他人博客,
* 有时候代码块前面的序号会在代码下面,将ul替换,就不会显示序号
* */
public class Main2 {

    static File file2 = new File("E:/paper/blog0.xml");//Persons.xml文件绝对路径
    static File file3 = new File("E:/paper/blog1.xml");//Persons.xml文件绝对路径

    public static void main(String[] args) throws Exception {
        BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(file2)));
        BufferedWriter writer = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(file3)));

        String tmpStr="";

        String regStr = "<ul class=\"pre-numbering\" .*>(.*)</ul>";
        Pattern pattern = Pattern.compile(regStr);

        while((tmpStr=reader.readLine())!=null){
            Matcher m = pattern.matcher(tmpStr);
            if (m.find()) {
                String strFind = m.group(0);
                tmpStr = tmpStr.replace(strFind, "");
            }
            writer.write(tmpStr);
        }

        writer.flush();
        reader.close();
        writer.close();
    }
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值