2.4正则表达式初步
现代计算机大多数处理非数值任务
所以应当熟悉串的API
串的:
搜索 匹配 分隔 替换
处理工具:正则表达式regular expression
其发展已经相当成熟,几乎可以当做一门独立的语言
有一套完整的规则和独立的语法系统
Java内置了对正则的支持
Java串的API中涉及的正则表达式
Split
正则表达式应用——Split
package RegularExpression;
public class SplitTest {
public static void main(String[] args) {
String s = "abc zyx aaa bbb";//空格较多时,会产生空串
// String s = "abc+zyx+aaa+bbb";
// String ss[] = s.split(" {1,}");//" {1,}"正则写法,最少出现1次,最多出现任意多次(不谢就是任意多次)
String ss[] = s.split(" +");//" +"和上面是同一个意思
//如果用+作分隔符,则必须转义,
//----- "\\+" 表示 "+"
//----- "\\{" 表示 "{"
//----- "\\" 表示 "\"
for(int i=0;i<ss.length;i++){
System.out.println(ss[i]);
}
}
}
abc
zyx
aaa
bbb
//如果用+作分隔符,则必须转义,
//----- "\\+" 表示 "+"
//----- "\\{" 表示 "{"
//----- "\\" 表示 "\"
Match
判断给定的字符串是否满足正则表达式
Excel地址规则
package RegularExpression;
public class MatchTest {
public static void main(String[] args) {
String s = "AB88";
System.out.println(s.matches("[A-Z]{1,}[0-9]{1,}"));
//"[A-Z]{1,}[0-9]{1,}" 表示 A到Z出现了1次到无穷次,0到9出现了1次到无穷次
//注:原视频中讲的有错误,在Excel中,列是26进制的从A到Z,然后是AA...AZ,然后是AAA,AAB.....
//可以出现三次字母的,不信你自己去看Excel!
}
}
true
可以用于:判断手机号,身份证号,年龄等一些需要用户输入的要素 ,防止用户输入明显错误的信息
[A-Z]{1,5}方括号表示出现的内容,大括号表示出现的次数(量词)
+ 表示 {1,} 最少一次
* 表示 {0,} 任意多次
? 表示 {0,1} 零次或一次
replaceAll
格式替换
2005-12-05 à 05/12 2005年
/*
replaceAll
格式替换
2005-12-05 05/12 2005年
*/
package RegularExpression;
public class ReplaceAllTest {
public static void main(String[] args) {
// TODO Auto-generated method stub
String s = "sdf jkjsd f2014-04-23我在写代码' ;d'dfs ";
// s=s.replaceAll("[0-9]{4}-[0-9]{2}-[0-9]{2}", "***");
s=s.replaceAll("([0-9]{4})-([0-9]{2})-([0-9]{2})", "$3/$2 $1年");
//子组:在正则表达式中,用括号()括起来的部分称为子组
//$1,表示第一个子组
//$2,表示第二个子组
System.out.println(s);
}
}
sdf jkjsd f23/04 2014年我在写代码' ;d'dfs
// 子组 :在正则表达式中,用括号 () 括起来的部分称为子组
//$1,表示第一个子组
//$2,表示第二个子组
分散字符串
请把下列字符串分散为数字和字符构成的串
String s1 ="abc1234xyz667kkmd764tttt";
串由字母和数字间隔构成,要分离出所有的字母段和数字段,即:
abc
1234
xyz
667
kkmd
764
tttt
/*
* 分散字符串
请把下列字符串分散为数字和字符构成的串
String s1 = "abc1234xyz667kkmd764tttt";
串由字母和数字间隔构成,要分离出所有的字母段和数字段,即:
abc
1234
xyz
667
kkmd
764
tttt
*/
package RegularExpression;
import java.util.ArrayList;
import java.util.List;
public class SplitString {
public static void main(String[] args) {
String s = "1234xyz667kkmd764tttt123";
String []s1 = s.split("[a-z]+");//分别分割成两个字符串数组
String []s2 = s.split("[0-9]+");
List<String> list = new ArrayList<String>();
if(Character.isLetter(s.charAt(0))){//如果以字母开头
for(int i=0;i<s1.length-1;i++){
list.add(s1[i]);//加到list里
list.add(s2[i]);
}
if(Character.isLetter(s.charAt(s.length()-1))){//如果以字母结尾
showSplit(list);
}
if(Character.isDigit(s.charAt(s.length()-1))){//如果以数字结尾
list.add(s1[s1.length-1]);
showSplit(list);
}
}
if(Character.isDigit(s.charAt(0))){//如果以数字开头
for(int i=0;i<s2.length-1;i++){
list.add(s2[i]);
list.add(s1[i]);
}
if(Character.isLetter(s.charAt(s.length()-1))){//如果以字母结尾
list.add(s2[s2.length-1]);
showSplit(list);
}
if(Character.isDigit(s.charAt(s.length()-1))){//如果以数字结尾
list.add(s2[s2.length-1]);
list.add(s1[s1.length-1]);
showSplit(list);
}
}
}
public static void showSplit(List<String> list){
for(int i=1;i<list.size();i++){
System.out.println(list.get(i));
}
}
}
1234
xyz
667
kkmd
764
tttt
123
上述代码略显繁琐,若您有更好的想法欢迎留言。