SQL Server中全角和半角字符的比较问题

SQL Server排序规则解决主键重复问题

最新推荐文章于 2023-02-06 16:31:27 发布

原创最新推荐文章于 2023-02-06 16:31:27 发布 · 7.4k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#sql server #数据库 #文档 #sql

SQL Server 专栏收录该内容

9 篇文章

订阅专栏

博客讲述项目中因全角和半角括号字符差异导致SQL Server出现重复主键问题。原因是数据库排序规则未区分宽度，默认排序规则认同两者等效。正确做法是选择后缀为WS的中文排序规则，如Chinese_PRC_CI_AS_WS，还给出查看排序规则的SQL语句。

/*------------------------------------------------------------------------------------

/*欢迎转载，请保留本声明信息

/*作者：翁彦 enhydraboy@yahoo.com.cn

/*------------------------------------------------------------------------------------

这是一个在我实际一个项目中遇到的问题。03BHL01001（上海）和03BHL01001(上海)比较的结果是一样的。导致引起的重复的主键问题。

03BHL01001（上海）和03BHL01001(上海)差别，就在于前者的括号是全角的括号字符，后者是半角的括号字符。全角的括号字符和半角的括号字符的ascii码显然是不一样的。全角的（ ASCII码是0xA3A8 ，而半角的( 是0x28。那么为什么SQL Server会认为是一样的呢？

问题其实就出在数据库的排序规则上，让我们在仔细研读一下SQL Server的文档。SQL Server的排序规则由这样几部分组成，代码页、区分大小写、区分重音、区分宽度。最后一个在SQL Server的联机帮助中没有进一步提及，其实本篇遇到的问题就是由于这个原因造成的。区分宽度：指定 SQL Server 区分相同字符的单字节表示法（半角）和双字节表示法（全角）。如果没有选择，则 SQL Server 将认为相同字符的单字节表示法和双字节表示法等效。

缺省，安装SQL Server中文版的时候，SQL Server帮你选择的排序规则是Chinese_PRC_CI_AS(Chinese-PRC, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive),是中文，不区分大小写、区分重音、不区分假名、不区分宽度。因此，自然就认同03BHL01001（上海）=03BHL01001(上海)。

所以，正确的选择应该是，后缀为WS的中文排序规则。本例中我们应该选择Chinese_PRC_CI_AS_WS。

我们来看一下，指定排序规则是Chinese_PRC_CI_AS_WS后，怎么样了？

select 1 where '03BHL01001（上海）'='03BHL01001(上海)'

collate Chinese_PRC_CI_AS_WS

-----------

（所影响的行数为 0 行）

看来这个问题解决了。

重要提示：

如何察看使用那个排序规则呢？可以使用下面的SQL语句。

SELECT *

FROM ::fn_helpcollations()

可以查询所有排序规则的信息。