java string 替换img标签 正则表达式 任意多个字符

本文介绍如何使用正则表达式去除HTML标签,通过具体的Java代码实例展示了如何匹配并清除特定的HTML标签如锚点链接和图片标签,适用于文本预处理等场景。

正则表达式 任意多个字符

(.*)  正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字符

要匹配包括 '\n' 在内的任何字符,([\s\S]*) 也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。 

在文本文件里, 这个表达式可以匹配所有的英文
/[ -~]/
这个表达式可以匹配所有的非英文(比如中文)
/[^ -~]/ 

=======

 

  1. public static void main(String[] args) {  
  2.     String contentString = "sdfsd abc---abc <a href='http://www.hao123.com'>" +  
  3.             "http://www.hao123.com</a><img title='img' src='abc' />" +  
  4.             "sdfsdfds";  
  5.     contentString=contentString.replaceAll("<a href[^>]*>", "");  
  6.     contentString=contentString.replaceAll("</a>", "");  
  7.     contentString=contentString.replaceAll("<img[^>]*/>", " ");  
  8.     System.out.println(contentString);  
  9. }  

转载于:https://www.cnblogs.com/yue31313/p/7685792.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值