CHAR,VARCHAR,VARCHAR2,nvarchar,nvarchar2的用法和区别

本文详细介绍了 SQL 中 CHAR、VARCHAR、VARCHAR2、NVARCHAR 和 NVARCHAR2 等数据类型的特性及区别,包括它们如何处理不同长度和编码的字符串数据。

CHAR:

1.长度固定,当char(15)的元素中只有“abc”时,其余十二位用空格填补;

VARCAHR:

1.长度不固定,该列中元素有多少位,就是多少位;

2.当数据为空时,该字段为空字符串;

3.VARCHAR只对汉字或全角字符占两个字节处理,数字和英文等都是一个字节;

VARCHAR2:

1.当数据为空时,该数据显示为NULL;

2.VARCHAR2(一般情况下)把所有字符都按两个字节处理,VARCHAR2字符要用几个字节存储,要看数据库使用的字符集,
比如GBK,汉字就会占两个字节,英文1个
如果是UTF-8,汉字一般占3个字节,英文还是1个。 
但是一般情况下,我们都认为是两个字节处理,因为oracle安装时候默认我们都选择GBK的编码格式,但是我们在页面做输入字符串长度的校验的时候,还是以数据库设计字段最大长度除3来作为最大长度-----防止数据库移植时设置不同编码格式;

nvarcahr和nvarchar(2)

联系:1.都用于存储可变长度的字符串;

          2.SIZE的最大值为4000,最小值为1(是字符个数,不是字节数)

          3.这两种类型跟适合存储中文;

区别:1.nvarchar中,中文字符按两个字节计算,英文字符按一个字符计算;

          2.nvarchar2中,所有字符都按两个字节计算;

          3.nvarchar2虽然更占内存,但是兼容性比较好,所以推荐使用。

`VARCHAR2` `NVARCHAR2` 是 Oracle 数据库中两种常用的字符串数据类型,它们在存储方式、字符集支持、长度单位使用场景上有显著区别。 --- ### ✅ 核心区别总结: | 特性 | `VARCHAR2` | `NVARCHAR2` | |------|------------|-------------| | 字符集 | 数据库字符集(如 `AL32UTF8`、`WE8ISO8859P1`) | 国家字符集(通常是 Unicode,如 `AL16UTF16` 或 `UTF8`) | | 是否支持多语言(如中文、日文) | 依赖数据库字符集 | ✅ 原生支持 Unicode,适合多语言 | | 长度单位 | 可以是字节(BYTE)或字符(CHAR),取决于定义 | 始终以 **字符** 为单位 | | 最大长度 | 最大 4000 字节(或字符,取决于设置) | 最大 4000 字符(Oracle 12.1 及之前),可扩展至 32767(12.2+) | | 存储效率 | 更节省空间(ASCII 占 1 字节) | 每个字符通常占 2~4 字节,稍大 | | 推荐用途 | 存储英文、固定语言环境的文本 | 存储多语言、国际化文本(如中文、表情符号等) | --- ### 🔍 详细解释 #### 1. **字符集不同** - `VARCHAR2` 使用的是 **数据库字符集**(由 `NLS_CHARACTERSET` 定义),可能不完全支持 Unicode。 - 例如:如果数据库字符集是 `WE8ISO8859P1`(西欧编码),则无法正确存储汉字。 - `NVARCHAR2` 使用的是 **国家字符集**(由 `NLS_NCHAR_CHARACTERSET` 定义),通常是 Unicode 编码(`AL16UTF16` 或 `UTF8`),天生支持所有语言。 > 📌 查看国家字符集: ```sql SELECT * FROM nls_database_parameters WHERE parameter IN ('NLS_CHARACTERSET', 'NLS_NCHAR_CHARACTERSET'); ``` #### 2. **长度语义不同** - `VARCHAR2(100)` 默认按 **字节** 计算(除非指定 `CHAR`): ```sql VARCHAR2(100) -- 最多 100 字节 VARCHAR2(100 CHAR) -- 最多 100 字符(推荐用于中文) ``` 在 UTF8 下,一个汉字占 3 字节,所以 `VARCHAR2(100)` 最多只能存约 33 个汉字。 - `NVARCHAR2(100)` 始终表示 **最多 100 个字符**,无论是否是汉字: ```sql NVARCHAR2(100) -- 可以存 100 个汉字 ✅ ``` #### 3. **存储空间差异** | 字符 | `VARCHAR2` (UTF8) | `NVARCHAR2` (AL16UTF16) | |------|-------------------|-------------------------| | `'A'`(英文) | 1 字节 | 2 字节 | | `'中'`(汉字) | 3 字节 | 2 字节 | | `'🙂'`(表情) | 4 字节 | 4 字节 | > 所以 `NVARCHAR2` 对英文略浪费空间,但对多语言更友好。 #### 4. **使用建议** | 场景 | 推荐类型 | |------|----------| | 纯英文系统,追求性能空间 | `VARCHAR2` | | 中文、日文、韩文等多语言系统 | `NVARCHAR2` | | 不确定语言环境的国际化应用 | `NVARCHAR2` | | 需要精确控制字符数(如姓名限制 10 个汉字) | `NVARCHAR2(10)` 或 `VARCHAR2(10 CHAR)` | --- ### ✅ 示例对比 ```sql -- 创建测试表 CREATE TABLE test_string_types ( v1 VARCHAR2(10), -- 最多 10 字节 v2 VARCHAR2(10 CHAR), -- 最多 10 字符 nv NVARCHAR2(10) -- 最多 10 字符(Unicode) ); -- 插入数据 INSERT INTO test_string_types VALUES ('abcdefghij', 'abcdefghij', N'abcdefghij'); -- OK INSERT INTO test_string_types VALUES ('中国', '中国', N'中国'); -- OK INSERT INTO test_string_types VALUES ('中国中国中国', '中国中国中国', N'中国中国中国'); -- v1 可能失败(超字节) INSERT INTO test_string_types VALUES ('中国中国中国中国', '中国中国中国中国', N'中国中国中国中国'); -- v1/v2 失败,nv 成功? -- 实际取决于具体字符数编码 ``` --- ### ❌ 常见误区 | 误解 | 正确理解 | |------|----------| | `VARCHAR2(10)` 能存 10 个汉字 | 错!如果是字节模式且 UTF8,最多约 3~6 个汉字 | | `NVARCHAR2` 更慢所以不用 | 性能差异微小,安全性与兼容性更重要 | | 所有 `VARCHAR2` 都支持中文 | 错!取决于数据库字符集是否支持 | --- ### ✅ 总结 - 如果你的系统主要处理英文或单一语言,且追求存储效率 → 使用 `VARCHAR2(n CHAR)`。 - 如果你要支持中文、日文、表情符号等多语言内容 → **强烈推荐使用 `NVARCHAR2`**。 - `NVARCHAR2` 是为 Unicode 设计的“安全选择”,避免乱码问题。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值