最近在做一个自然语言处理方面的研究,需要用到SQL SERVER来做一些工作,结果把我折腾的够呛。主要是两方面的问题,一是如何连接SQL SERVER,而是关于中文的存储问题。
1.如何连接SQL SERVER
我们都知道,VS2012,VS2013新增的轻量级数据库LocalDB,实例名:Data Source=(localDB)\V11.0,但是其默认的排序规则"Latin1_General_CI_AS_KS_WS",导致中文存储的乱码(后面讲如何解决)。于是乎,我装了SQL SERVER 2012,这下可好,数据库无法连接,实例名等等肯定是对的,着实让我烦恼了很久,后来。。
登陆之后,我们对数据库的连接进行修改!
修改连接数据库实例名!
这样就OK了!但是中文乱码怎么办?
2.解决中文乱码
1.右键数据库实例,新建查询修改数据库为单用户模式
alter database [数据库名或完整路径] set single_user with rollback immediate ;
go
2.修改排序规则(这里为中文--拼音--不区分大小写)
alter database [数据库名或完整路径] collate Chinese_PRC_CI_AS ;
go
3.重新设置为多用户模式
alter database [数据库名或完整路径] set multi_user;
其中排序规则名称由两部份构成,前半部份是指本排序规则所支持的字符集。
如:
Chinese_PRC_CS_AI_WS
前半部份:指UNICODE字符集,Chinese_PRC_指针对大陆简体字UNICODE的排序规则。排序规则的后半部份即后缀含义:
_BIN 二进制排序
_CI(CS) 是否区分大小写,CI不区分,CS区分 区分大小写:如果想让比较将大写字母和小写字母视为不等,请选择该选项。
_AI(AS) 是否区分重音,AI不区分,AS区分 区分重音:如果想让比较将重音和非重音字母视为不等,请选择该选项。如果选择该选项,比较还将重音不同的字母视为不等。
_KI(KS) 是否区分假名类型,KI不区分,KS区分 区分假名:如果想让比较将片假名和平假名日语音节视为不等,请选择该选项。
_WI(WS) 是否区分宽度 WI不区分,WS区分 区分宽度:如果想让比较将半角字符和全角字符视为不等,请选择该选项

参考资料:
http://jingyan.baidu.com/article/c74d600060804a0f6a595dfd.html