[遇到的问题]java正则表达式

本文介绍了一次使用Java正则表达式去除重复内容的经历,特别指出标准正则表达式中的w不适用于匹配汉字,而应使用W。通过具体示例展示了如何正确匹配并去除重复的汉字短语。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

正则表达式是一个非常强大的工具。可以完成许多我们需要很多代码量的工作。

我自己对于正则表达式没有系统的认真学过,平时总是用的时候再临时查(ps主要是因为本人太懒!)。所以很多知识都很模糊。

今天在写java程序时用正则表达式来去除重复的内容。举个例子:

	public static void main(String [] args){
		Pattern pat = Pattern.compile("(\\w+),\\1");
		String test = "咱们结婚吧,咱们结婚吧";
		
		Matcher m = pat.matcher(test);
		
		if(m.find()){
			System.out.println("match");
			System.out.println(m.group(1));

		}
		else System.out.println("no match");
		
	}

结果总是 no match。

后来在网上查了一下才知道,原来是各个平台对正则表示元字符的解释不同。在java中,\w不能匹配汉字,需要用\W来匹配汉字。这与原始的正则表达式不同。

经过修改后,表达式可以正确匹配了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值