Watson Explorer 入门(12):词典

本文介绍了自定义词典的概念及应用,包括词条特征、词形变化等,还讲解了如何利用RDF文件构建词典,适用于内容分析和信息检索。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

自定义词典

自定义词典包含了一个项目清单,这些项目用于特殊的知识领域和相关信息。例如,自定义字典可能包含世界上的城市列表和其他信息,如每个城市的纬度和人口。附加信息称为特征。稍后可以在创建的分析规则中使用这些功能。

词条还可以有选择性的表面形式,如词形变化和同义词。例如,在人名称词典中“医生”一词可能有另一种形式Dr。创建词典数据库时,可以使用一个词形查找字典,帮我们自动完成添加词条的词形变化。

除了创建包含特定域实体的自定义字典之外,还可以创建包含帮助表示特定类型实体存在的术语的自定义字典。例如,公司指标的词典可能包括缩写 Co 和 Inc。当你在 UIMA 管道中包括在您的自定义字典时,管道标识和注释在你的文件中找到的这些词条。

自定义词典入口的源数据保存在词典数据库中。可以把这个数据库构建在编译的DIC词典文件中,该词典文典可以包含在UIMA管道的词法分析阶段。

分析构面词典

一个分析构面字典是一种自定义字典,可以直接部署到沃森资源管理器内容分析,并产生分析集合的构面值。例如,您可以使用分析构面字典来生成从RDF文件中提取的术语的构面。

词法分析词典

词法分析字典包含所有在特定语言中使用的单词和关于每个术语的语言信息,如它的一部分语言以及单词是否可以与其他词一起构成复合词。内容分析工作室为支持的语言提供词法分析词典。如果您想在内容分析工作室中添加更多的语言支持,您必须为该语言创建词法分析字典。

  • 创建自定义词典

可以创建包含特定知识域中术语的自定义字典。当你在UIMA管道中包括在您的自定义字典时,管道标识和诠释文档中能够找到的词条。

  • 从RDF文件构建字典和构面树

您可以创建从资源描述框架(RDF)文件中提取的术语字典。例如,你可能从DBpedia RDF文件中提取的条件创造一个化学物质词典。当你部署分析小词典对你的华生Explorer内容分析服务器集合,Watson Explorer内容分析管道诠释这些条款的情况下,在你的文件中发现了这些条款方面。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

许野平

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值