Overview of Full Text Stop Words(MSSQL全文索引的干扰词概括)MSSQL 全文索引的最小单词长度...

什么叫做Stop words(干扰词)呢

这些词不用于全文索引。这些词一般都是比较常用的词,一般不用于搜索,如果用于搜索,则有很多返回结果。比如'a','the'这些词。Stop words不用于索引,所以不能被搜索到。 

经过测试MSSQL 全文索引的最小单词的长度为2,最大的单词长度为30。也就是为如果长度为1(如'e')的是不能被搜索到的。但('ee')是可以被搜索到的。

Stop words(干扰词)的位置:

这些Stop words根据不同的语言分别存放在不同的文件中。(比如noiseENU.txt, noiseCHS.txt)

用select @@language来查看当前语言

如果你是默认安装SQL的话,目录为:

 C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\FTData

修改Stop words(干扰词)步骤:

1. disable change tracking 

 ALTER FULLTEXT INDEX ON kbcontents SET CHANGE_TRACKING OFF


2. Stop full-text catalog population. 

 ALTER FULLTEXT INDEX ON KBContents STOP POPULATION


3 修改 noiseENU.txt, noiseCHS.txt 文件(最好先备份)


4. Repopulate the full-text catalogs. 
  ALTER FULLTEXT INDEX ON table_name SET CHANGE_TRACKING AUTO

默认英文干扰词列表 (“noiseENG.txt”):

1beforetheseonhim
2beingtheyonlyhimself
3betweenthisorhis
4boththoseotherhow
5butthroughourif
6bytooutin
7cametoooverinto
8canunderreis
9comeupsaid it
0couldusesameits
aboutdidveryseejust
afterdowantshouldlike
alldoeswassincemake
alsoeachwaysomany
anelse wesomeme
andforwellstillmight
anotherfromweresuchmore
anygetwhattakemost
are got whenthanmuch
ashaswherethatmust
athadwhichthemy
behewhiletheirnever
$havewhothemno
becauseherwillthennow
beenherewiththereof
wouldyouyour  
a b c d e f g h i j k l m n o p q r s t u v w x y z

相关搜索: change fulltext index minmum length MSSQL,  全文索引的单词长度受限

 

转载于:https://www.cnblogs.com/webfpc/archive/2009/10/24/1588999.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值