JAVA处理html标签

package com.nfa;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class UtilHtml {
	
	/*删除所有HTML标签,返回纯文本*/
	public static String deleteAll(String html){
		if(isBlank(html)){
			return "";
		}
		Pattern p = Pattern.compile("<([^>]*)>");
		Matcher m = p.matcher(html);
		return m.replaceAll("");
	}
	
	/*删除指定单标签*/
	public static String deleteTagsOfOne(String tag,String html){
        String regxp = "<\\s*" + tag + "\\s+([^>]*)\\s*>";   
        Pattern p = Pattern.compile(regxp);   
        Matcher m = p.matcher(html);   
        StringBuffer sb = new StringBuffer();   
        boolean rs = m.find();   
        while (rs) {   
            m.appendReplacement(sb, "");   
            rs = m.find();   
        }   
        m.appendTail(sb);   
        return sb.toString();   	
	}
	
	/*删除指定成对标签*/
	public static String deleteTagsOfTwo(String tag,String html){
		if(isBlank(html)){
			return html;
		}
		Pattern p = Pattern.compile("<"+tag+"[^>]*?>[\\s\\S]*?<\\/"+tag+">");
		Matcher m = p.matcher(html);
		return m.replaceAll("");		
	}	
	
	/*删除指定的属性*/
	public static String deleteAttr(String attr,String html){
		if(isBlank(html)){
			return html;
		}
		Pattern p = Pattern.compile(attr+"=\"([^\"]+)\"");
		Matcher m = p.matcher(html);
		return m.replaceAll("");
	}
	
	/*删除所有空白字符*/
	public static String deleteAllBlank(String html){
		if(isBlank(html)){
			return html;
		}
		Pattern p = Pattern.compile("[\\s| ]");
		Matcher m = p.matcher(html);
		return m.replaceAll("");
	}
	
	private static boolean isBlank(String str){
		if(str!=null && str.trim().length()>0){
			return false;
		}else{
			return true;
		}
	}
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值