Java基本数据类型
数据类型 | 位数 | 字节数 |
---|---|---|
byte | 8位 | 1字节 |
char | 16位 | 2字节 |
short | 16位 | 2字节 |
int | 32位 | 4字节 |
float | 32位 | 4字节 |
double | 64位 | 8字节 |
long | 64位 | 8字节 |
MySQL中varchar的中文与英文的字节不同编码类型比较
一、UTF-8
- UTF-8 Unicode Transformation Format-8bit。是用以解决国际上字符的一种多字节编码。
它对英文使用 8 位(即一个字节) ,中文使用 24 位(三个字节)来编码。
- UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。
- UTF-8编码的文字可以在各国支持 UTF8 字符集额的浏览器上显示。 如果是UTF8编码,则在外国人的英文 IE 也能显示中文,他们无需下载 IE 的中文语言支持包。
二、GBK
- GBK 是国家标准 GB2312 基础上扩容后兼容 GB2312 的标准。
- GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成 1。
- GBK包含全部中文字符,是国家编码,通用性比 UTF8 差,不过 UTF8 占用的数据库比GBK大。
三、utf8mb4
- 从 MySQL 5.5 开始,可支持 4 个字节 UTF 编码 utf8mb4,一个字符最多能有 4 字节,所以能支持更多的字符集。
- tf8mb4 兼容 utf8,且比 utf8 能表示更多的字符。
注:在做移动应用时,会遇到IOS用户在文本的区域输入emoji表情,如果不做一定处理,就会导致插入数据库异常。
- 引用文章