剖析字符串与数组的底层实现
字符串jdk8和jdk9的区别
jdk8:底层是一个char[]数组
jdk9及之后:底层是一个byte[]数组
一个中文占两个字节,一个char占两个字节,一个byte占一个字节
Jdk9及之后的版本中,多了一个code属性,这个属性标记是告诉调用者按几个字节来取的问题,
如果按byte存储的话,存不是什么问题,问题是如何取呢?
String在9版本之后是根据code属性来区分的:
如果是英文则按照LATIN编码格式,1个字节1个字节地取
如果是中文则按照UTF16两个字节来取
JDK9的字符串去重:
G1:经历了三次GC,-XX:+UseG1GC -XX:+UseStringDeduplication
底层原理:用== 判断不是同一个字符串,内容是否相等
优缺点:它是一个CPU密集型的
String类重写了hashCode方法
可以看出String的hashcode与String的内容是有关系的