Java字符串相关类(String,StringBuffer,StringBuilder)
1. String基本概念
- String声明为final的,不可被继承
- String实现了
- Serializable接口:表示字符串是支持序列化的(IO流中会介绍)
- Comparable接口:表示String可以比较大小
- String在内部定义了final char[] value用于存储字符串数据
- String代表不可变的字符序列,即String具有不可变性
通过字面量赋值(区别于new),此时的字符串值声明在字符串常量池中
字符串常量池中是不会存储相同的内容的
- 当对字符串重新赋值时,需要重新指定内存区域赋值,不能使用原有的value进行赋值
- 当进行连接操作时,也需要重新指定内存区域赋值,不能在原有的value上进行修改
- 当调用String的replace修改指定的字符或字符串时,也必须重新指定新的内存区域
2. String对象的创建
String str = "hello";
//本质上this.value = new char[0];
String s1 = new String();
//this.value = original.value;
String s2 = new String(String original);
//this.value = Arrays.copyOf(value,value.length);
String s3 = new String(char[] a);
String s4 = new String(char[] a,int startIndex,int count);
2.1 实例化方式的对比
- 通过字面量定义
- 通过new + 构造器的方式创建对象
注意
- 通过new创建的对象是存放在堆空间中的
- 而对象的内容是指向字符串常量池的地址值
一道面试题:
Q:String s = new String(“abc”);方式创建对象,在内存中创建了几个对象?
A:两个。
- 一个是堆空间中new的结构
- 另一个是char[]对应的常量池中的数据:“abc”
字符串拼接
@Test
public void test2() {
String s1 = "javaEE";
String s2 = "hadoop";
String s3 = "javaEEhadoop";
String s4 = "javaEE" + "hadoop";
String s5 = s1 + "hadoop";
String s6 = "javaEE" + s2;
String s7 = s1 + s2;
System.out.println(s3 == s4);//true
System.out.println(s3 == s5);//false
System.out.println(s3 == s6);//false
System.out.println(s3 == s7);//false
System.out.println(s5 == s6);//false
System.out.println(s5 == s7);//false
System.out.println(s6 == s7);//false
String s8 = s5.inter();
System.out.println(s3 == s8);//true
}
结论:
- 常量和常量拼接结果在常量池,且常量池中不会存在相同内容的常量
- 字符串拼接中有一个是变量,结果就在堆中(相当于new创建一个新对象)
- 如果拼接的结果调用inter()方法,返回值是指向常量池的
3.String中的常用方法
- int length():返回字符串的长度: return value.length
- char charAt(int index): 返回某索引处的字符return value[index]
- boolean isEmpty():判断是否是空字符串:return value.length == 0
- String toLowerCase():使用默认语言环境,将 String 中的所有字符转换为小写
- String toUpperCase():使用默认语言环境,将 String 中的所有字符转换为大写
- String trim():返回字符串的副本,忽略前导空白和尾部空白
- boolean equals(Object obj):比较字符串的内容是否相同
- boolean equalsIgnoreCase(String anotherString):与equals方法类似,忽略大小写
- String concat(String str):将指定字符串连接到此字符串的结尾。 等价于用“+”
- int compareTo(String anotherString):比较两个字符串的大小
- String substring(int beginIndex):返回一个新的字符串,它是此字符串的从beginIndex开始截取到最后的一个子字符串。
- String substring(int beginIndex, int endIndex) :返回一个新字符串,它是此字符串从beginIndex开始截取到endIndex(不包含)的一个子字符串。
(左闭右开)
- boolean endsWith(String suffix):测试此字符串是否以指定的后缀结束
- boolean startsWith(String prefix):测试此字符串是否以指定的前缀开始
- boolean startsWith(String prefix, int toffset):测试此字符串从指定索引开始的子字符串是否以指定前缀开始
- boolean contains(CharSequence s):当且仅当此字符串包含指定的 char 值序列时,返回 true
- int indexOf(String str):返回指定子字符串在此字符串中第一次出现处的索引
- int indexOf(String str, int fromIndex):返回指定子字符串在此字符串中第一次出现处的索引,从指定的索引开始
- int lastIndexOf(String str):返回指定子字符串在此字符串中最右边出现处的索引
- int lastIndexOf(String str, int fromIndex):返回指定子字符串在此字符串中最后一次出现处的索引,从指定的索引开始反向搜索
注:indexOf和lastIndexOf方法如果未找到都是返回-1
- String replace(char oldChar, char newChar):返回一个新的字符串,它是通过用 newChar 替换此字符串中出现的所有 oldChar 得到的。
- String replace(CharSequence target, CharSequence replacement):使用指定的字面值替换序列替换此字符串所有匹配字面值目标序列的子字符串。
- String replaceAll(String regex, String replacement) : 使用给定的replacement 替换此字符串所有匹配给定的正则表达式的子字符串。
- String replaceFirst(String regex, String replacement) : 使用给定的replacement 替换此字符串匹配给定的正则表达式的第一个子字符串。
- boolean matches(String regex):告知此字符串是否匹配给定的正则表达式。
- String[] split(String regex):根据给定正则表达式的匹配拆分此字符串。
- String[] split(String regex, int limit):根据匹配给定的正则表达式来拆分此字符串,最多不超过limit个,如果超过了,剩下的全部都放到最后一个元素中。
4. String和其他类型的转换
4.1 String和基本数据类型、包装类的转换
- String转化为基本数据类型、包装类:调用包装类的静态方法
调用包装类的Integer.parseInt()等方法int num = Integer.parseInt("123");
- 将基本数据类型转化为字符串
String str = String.valueOf(num);
4.2 String和char[]之间的转换
-
String转化为char[]数组:调用String的toCharArray()方法
String str = "123abc"; char[] arr = str.toCharArray();
-
将char[]转化为String:调用String的构造器即可
char[] arr = new char[]{'h','e','l','l','o'}; String str = new String(arr); System.out.println(str);
4.3 String和byte[]之间的转换
这里String和byte[]的转化,相当于编码和解码,涉及到编码集的问题
-
将String转化为byte[]:调用String类型对象的getBytes()
String str = "abc123"; byte[] bytes = str.getBytes(); //使用默认的编码集UTF-8 System.out.println(Arrays.toString(bytes));
- UTF-8中一个汉字占3个字节
- gbk中一个汉字占2个字节
-
将byte[]转化为String:调用String的构造器
String str = new String(bytes); //指定解码集,编码集和解码集不一致会出现乱码 String str = new String(gbks,"GBK");
5.StringBuffer、StringBuilder类
5.1 String,StringBuffer,StringBuilder的比较
- String:不可变的字符序列
- StringBuffer:可变的字符序列(线程安全的,效率低)
- StringBuilder:可变的字符序列(线程不安全,效率高)(JDK5.0新增)
相同点:
- 底层都是char[]数组存储的
- StringBuffer和StringBuilder的都是继承AbstractStringBuilder父类,里面的方法基本是一致的,差距主要在线程是否安全
不同点
- StringBuffer的源码中,初始分配的char数组长度为为原始字符串长度+16
String如果是空参构造,初始的char长度为0 - StringBuffer扩容问题
如果append会超过原有的容量,需要对数组进行扩容,
默认情况下,容量扩充为原来容量的2倍+2,同时将原有数组的元素复制到新的数组中(特殊情况下会有其他的一些处理) - 因为扩容也需要对数组进行复制,所以开发中建议使用如下的构造器(提前预估数组的大概长度)
public StringBuffer(int capacity); public StringBuilder(int capacity);
- 注意:虽然StringBuffer,StringBuilder底层会额外的分配空间,但是调用length返回的数值,还是实际字符串的长度,不是数组的总容量
一点源码分析:
String str = new String(); //char[] value = new char[0];
String str1 = new String("abc") //char[] value = new char[]{'a','b','c'};
StringBuffer sb1 = new StringBuffer(); //char[] value = new char[16] 底层创建了一个长度为16的数组
sb1.append('a'); //value[0] = 'a';
sb1.append('b'); //value[1] = 'b';
5.2 StringBuffer,StringBuilder中的常用方法
- public StringBuffer append(xxx):提供了很多的append()方法,用于进行字符串拼接
- public StringBuffer delete(int start,int end):删除指定位置的内容
- public StringBuffer replace(int start, int end, String str):把[start,end)位置替换为str(左闭右开)
- public StringBuffer insert(int offset, xxx):在指定位置插入xxx
- public StringBuffer reverse() :把当前字符序列逆转
- public int indexOf(String str)
- public String substring(int start,int end):返回一个从start到end的子串(左闭右开)
- public int length()
- public char charAt(int n )
- public void setCharAt(int n ,char ch)
总结:
- 增:append(xxx)
- 删:delete(int start,int end);
- 改:setCharAt(int n ,char ch)/replace(int start,int end,String str)
- 查:charAt(int n);
- 插:insert(int offset,xxx)
- 长度:length()
- 遍历:for()+charAt(int n);/toString()
5.3 效率从高到低:
StringBuilder > StringBuffer > String
//对比三者的效率
@Test
public void test3() {
//初始设置
long startTime = 0L;
long endTime = 0L;
String text = "";
StringBuffer buffer = new StringBuffer("");
StringBuilder builder = new StringBuilder("");
//开始对比
startTime = System.currentTimeMillis();
for (int i = 0; i < 20000; i++) {
buffer.append(String.valueOf(i));
}
endTime = System.currentTimeMillis();
System.out.println("StringBuffer的执行时间:" + (endTime - startTime));
startTime = System.currentTimeMillis();
for (int i = 0; i < 20000; i++) {
builder.append(String.valueOf(i));
}
endTime = System.currentTimeMillis();
System.out.println("StringBuilder的执行时间:" + (endTime - startTime));
startTime = System.currentTimeMillis();
for (int i = 0; i < 20000; i++) {
text = text + i;
}
endTime = System.currentTimeMillis();
System.out.println("String的执行时间:" + (endTime - startTime));
}