SQL Server中全角和半角字符的比较问题

博客讲述项目中因全角和半角括号字符差异导致SQL Server出现重复主键问题。原因是数据库排序规则未区分宽度,默认排序规则认同两者等效。正确做法是选择后缀为WS的中文排序规则,如Chinese_PRC_CI_AS_WS,还给出查看排序规则的SQL语句。

/*------------------------------------------------------------------------------------

/*欢迎转载,请保留本声明信息

/*作者:翁      enhydraboy@yahoo.com.cn

/*------------------------------------------------------------------------------------

这是一个在我实际一个项目中遇到的问题。03BHL01001(上海)和03BHL01001(上海)比较的结果是一样的。导致引起的重复的主键问题。

03BHL01001(上海)和03BHL01001(上海)差别,就在于前者的括号是全角的括号字符,后者是半角的括号字符。全角的括号字符和半角的括号字符的ascii码显然是不一样的。全角的( ASCII码是0xA3A8 ,而半角的( 0x28。那么为什么SQL Server会认为是一样的呢?

问题其实就出在数据库的排序规则上,让我们在仔细研读一下SQL Server的文档。SQL Server的排序规则由这样几部分组成,代码页、区分大小写、区分重音、区分宽度。最后一个在SQL Server的联机帮助中没有进一步提及,其实本篇遇到的问题就是由于这个原因造成的。区分宽度:指定 SQL Server 区分相同字符的单字节表示法(半角)和双字节表示法(全角)。如果没有选择,则 SQL Server 将认为相同字符的单字节表示法和双字节表示法等效。

缺省,安装SQL Server中文版的时候,SQL Server帮你选择的排序规则是Chinese_PRC_CI_AS(Chinese-PRC, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive),是中文,不区分大小写、区分重音、不区分假名、不区分宽度。因此,自然就认同03BHL01001(上海)=03BHL01001(上海)

所以,正确的选择应该是,后缀为WS的中文排序规则。本例中我们应该选择Chinese_PRC_CI_AS_WS

我们来看一下,指定排序规则是Chinese_PRC_CI_AS_WS后,怎么样了?

 

select 1 where '03BHL01001(上海)'='03BHL01001(上海)'

collate Chinese_PRC_CI_AS_WS

 

-----------

 

(所影响的行数为 0 行)

看来这个问题解决了。

重要提示:

如何察看使用那个排序规则呢?可以使用下面的SQL语句。

SELECT *

FROM ::fn_helpcollations()

可以查询所有排序规则的信息。

查出所有中文排序规则的信息

SELECT * FROM

(

SELECT *

FROM ::fn_helpcollations()) A

WHERE name like 'Chinese%'

 

SQL 中处理全角空格半角空格的转换,可以通过 Unicode 编码的特性来实现。全角空格的 Unicode 编码为 `12288`,而半角空格的编码为 `32`。因此,将全角空格转换为半角空格,只需将其 Unicode 编码减去 `12256`,即 `12288 - 32 = 12256`;反之,将半角空格转换为全角空格则加上该值。 ### 使用函数进行全角半角空格转换 可以创建一个自定义函数,用于处理字符串中的全角半角空格转换。以下是一个 SQL 函数示例,支持将全角空格转换为半角,或将半角空格转换为全角: ```sql CREATE FUNCTION dbo.ConvertSpaceWidth ( @InputString NVARCHAR(4000), @ConvertToHalf BIT -- 0: 转换为全角空格;1: 转换为半角空格 ) RETURNS NVARCHAR(4000) AS BEGIN DECLARE @i INT = 1; WHILE @i <= LEN(@InputString) BEGIN DECLARE @Char NCHAR(1) = SUBSTRING(@InputString, @i, 1); DECLARE @Code INT = UNICODE(@Char); IF @ConvertToHalf = 1 AND @Code = 12288 BEGIN SET @InputString = STUFF(@InputString, @i, 1, NCHAR(32)); END ELSE IF @ConvertToHalf = 0 AND @Code = 32 BEGIN SET @InputString = STUFF(@InputString, @i, 1, NCHAR(12288)); END SET @i = @i + 1; END RETURN @InputString; END ``` 该函数通过遍历输入字符串中的每个字符,判断其是否为全角半角空格,并根据参数 `@ConvertToHalf` 的值进行相应替换。 ### 直接查询中替换空格 如果不需要封装为函数,也可以在查询语句中直接使用 `REPLACE` 函数进行替换。例如,将字段中的全角空格替换为半角空格: ```sql SELECT REPLACE(YourColumnName, NCHAR(12288), NCHAR(32)) AS HalfWidthSpace FROM YourTableName; ``` 反之,若要将半角空格替换为全角空格: ```sql SELECT REPLACE(YourColumnName, NCHAR(32), NCHAR(12288)) AS FullWidthSpace FROM YourTableName; ``` 该方法适用于一次性转换,且无需创建额外的函数对象[^1]。 ### 结合 Unicode 编码范围进行批量处理 在处理全角字符整体转换时,空格需要单独处理,因为其 Unicode 编码并不在 `65281~65374` 的范围内。可以通过 `PATINDEX` `STUFF` 函数结合判断 Unicode 编码的方式进行批量处理: ```sql DECLARE @str NVARCHAR(4000) = N'这是一个测试 字符串'; DECLARE @pat NVARCHAR(8) = N'%[  ]%'; DECLARE @i INT = PATINDEX(@pat COLLATE Latin1_General_BIN, @str); WHILE @i > 0 BEGIN SET @str = STUFF( @str, @i, 1, CASE UNICODE(SUBSTRING(@str, @i, 1)) WHEN 32 THEN NCHAR(12288) -- 半角全角 WHEN 12288 THEN NCHAR(32) -- 全角半角 END ); SET @i = PATINDEX(@pat COLLATE Latin1_General_BIN, @str); END SELECT @str AS ConvertedString; ``` 该方法适用于需要动态识别并替换字符串中全角半角空格的场景[^2]。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值