什么是java的Compact Strings特性，什么情况下使用？

最新推荐文章于 2024-12-20 17:23:56 发布

原创最新推荐文章于 2024-12-20 17:23:56 发布 · 340 阅读

CC 4.0 BY-SA版权

文章标签：

在Java 9中引入了紧凑字符串（Compact Strings）特性，用来优化字符串的内存使用。简单来说，Java改进了字符串的存储方式，将之前的UTF-16字符数组改为字节数组，使得字符串能根据内容使用更节省内存的编码方式。以下是这个特性的核心内容：

什么是紧凑字符串

内部结构：
- 在Java 8及之前，字符串是用char[]字符数组存储的，每个字符占两个字节（UTF-16编码）。
- Java 9开始，字符串改为byte[]字节数组。对于只包含Latin-1（ISO-8859-1）字符的字符串，每个字符只需一个字节；若包含其他字符则仍使用两个字节（UTF-16）。
编码标识：
- Java 9中的每个字符串对象都有一个编码标识（coder），用于指示当前字符串的编码方式：
  - LATIN1（值为0）：只包含Latin-1字符。
  - UTF16（值为1）：包含其他字符（如中文）。
内存优化：
- 因为大多数字符串仅含Latin-1字符，这一特性大幅减少内存占用，一般能节省10%到15%的内存，降低垃圾回收的频率。

示例代码

以下代码展示了紧凑字符串的存储方式：

public class CompactStringExample {
    public static void main(String[] args) {
        String latinString = "Hello"; // 仅包含Latin-1字符
        String utf16String = "你好"; // 包含UTF-16字符

        // 打印每个字符串的内部字节数组长度
        System.out.println("Latin String Length: " + latinString.getBytes().length); // 输出5
        System.out.println("UTF-16 String Length: " + utf16String.getBytes().length); // 输出6
    }
}