FAST 常见问题-3

Q:FAST ESP所检索的文档集合能否被限制?

A:搜索可以被限制在一个文档的集合,或若干个文档集合,或由某个字段来限制。

 

Q:Fast ESP是否支持搜索检索的拼写检查?

A:FAST ESP支持搜索检索的拼写检查

 

Q:Fast ESP是否支持多种类型的通配符搜索?

A:FAST支持单字匹配(“?”)和多字匹配(“*”),支持前缀,后缀和嵌入式通配。

 

Q:FAST ESP能否自动识别检索中的专有名字和词组,以提高检索结果的相关度,并且能在特定情况下限制拼写纠正功能?

A:FAST搜索能自动识别用户检索中的专有名词和词组。具体的名称或词组识别被配置在一本基础字典中。自定义的名称或短语词典可以增加或合并到现有的字典中。

 

Q:FAST ESP是否提供相关度排名模型?

A:相关度是指搜索结果和检索条件的匹配程度,FAST的搜索引擎具有完整和灵活的相关度计算机制,以适应不同行业的不同应用,确保用户获得相关性最高的结果。

完整性:十几个可以调整的参数,包括“近似度”, “字段”, “关键字”, “新鲜度”, “业务规则”, “权威性”,“质量”, “链接级数”, “距离”, “上下文权重”, “统计”, “语言标准化的程度”等

灵活性: 开放的和可供调整的组合,适合你的相关度排名需要.

 

Q:相关度排名模型是否可以调整,以适应不同部门的需求?比如说研发部门,市场营销部门,客户服务部门和行政管理部门各提供什么样的排名算法?

A: FAST的相关度计算,使用以下因素加权平均,通过调整各个因素的权重形成不同的相关度计算方法,适应企业不同部门的需求

1、新鲜度:文档的时间? 例子: 最新的新闻排在最前面.

2、上下文:匹配发生在文档的不同部位其相关度是不同的?例子: 匹配发生在文档的标题比在正文具有更高的相关度

3、权威性:所命中的文档是否具有权威性?例子: 判断文档的权威性可以根据它是否被其他网页参照和联接

4、统计:所搜索的词语和文档之间的匹配度有多高?例子: 邻近度 (所搜索的词语之间在文档中的距离); 所搜索词语在文档中出现的频率

5、质量:所命中的文档的质量。例子: 首选目标网页;业务规则(例如,收入的潜力) ,编辑评级;新闻稿

6、距离:所命中的文档和我的距离?

对于研发部门,相关度计算以权威性为主,其次是统计特性;对于市场营销部门,相关度计算以新鲜度为主,其次是上下文对于客户服务部,相关度计算以统计特性为主,其次是权威性对于行政管理部门,相关度以质量特性为主,其次是上下文。

 

Q:FAST ESP是否提供自动分类功能?

A: 支持两种自动分类:基于规则的和基于样本实例的。基于规则的分类,管理员创建一个分类树 ,并指定每一分类节点背后的规则。在文档处理过程中,这些规则将被用来标记文件的类别,这些类别将对应分类树种的某个节点。例如,一个很简单的分类规则可能是:

 

       类别: 体育 = “足球 篮球 排球 网球 台球

 

左边对应的是最终的分类名称,右边对应的是文档在数据源中的URL属性,可能是原来的文件系统的某个子目录,又或者是原来的网页中的URI

由于手工制作分类规则需要花费非常大的人力,并且对某些应用难于做到非常精确,因此FAST搜索还提供了一个基于样本的能够自动的分类模式,系统管理员提供了一套文档,被认为是可以代表一个分类,然后运行一个训练工具,就能在文档处理的过程中自动生成基于样本的分类。

分类信息将和文档一起被索引,在搜索结果中,它们可以为用户提供导航和浏览的功能。

FAST为自动分类的规则的管理和样本训练提供一个可视化的工具,词表分类工作台。

 

Q:FAST ESP是否支持自动聚类?

A: FAST搜索平台支持自动聚类,这个功能是通过在文档的处理过程中,自动生成文档的特征向量,根据特征向量,将相似的文档聚合归类。所谓的特征向量,是由文档中出现的概念/关键字以及它出现的频率构成。

 

Q:FAST ESP产品在搜索结果中是否支持高亮度显示关键字?

A:FAST搜索平台在搜索结果中以高亮度的方式显示关键字词,并且用户通过点击关键字词直接到达包含和被搜索关键字的最相关的文档中的段落或句子。

 

Q: 用户或应用设计者能否限制搜索结果的数量?

A:是的,FAST搜索界面包含一个“采样数”参数用于指出在一页中返回的文档的数量,和一个“偏差”参数用于指出在结果集中应该在什么地方开始(如第十一个文档)。这可以由应用设计人员进行控制或暴露给用户进行控制。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值