自定义词典
自定义词典包含了一个项目清单,这些项目用于特殊的知识领域和相关信息。例如,自定义字典可能包含世界上的城市列表和其他信息,如每个城市的纬度和人口。附加信息称为特征。稍后可以在创建的分析规则中使用这些功能。
词条还可以有选择性的表面形式,如词形变化和同义词。例如,在人名称词典中“医生”一词可能有另一种形式Dr。创建词典数据库时,可以使用一个词形查找字典,帮我们自动完成添加词条的词形变化。
除了创建包含特定域实体的自定义字典之外,还可以创建包含帮助表示特定类型实体存在的术语的自定义字典。例如,公司指标的词典可能包括缩写 Co 和 Inc。当你在 UIMA 管道中包括在您的自定义字典时,管道标识和注释在你的文件中找到的这些词条。
自定义词典入口的源数据保存在词典数据库中。可以把这个数据库构建在编译的DIC词典文件中,该词典文典可以包含在UIMA管道的词法分析阶段。
分析构面词典
一个分析构面字典是一种自定义字典,可以直接部署到沃森资源管理器内容分析,并产生分析集合的构面值。例如,您可以使用分析构面字典来生成从RDF文件中提取的术语的构面。
词法分析词典
词法分析字典包含所有在特定语言中使用的单词和关于每个术语的语言信息,如它的一部分语言以及单词是否可以与其他词一起构成复合词。内容分析工作室为支持的语言提供词法分析词典。如果您想在内容分析工作室中添加更多的语言支持,您必须为该语言创建词法分析字典。
- 创建自定义词典
可以创建包含特定知识域中术语的自定义字典。当你在UIMA管道中包括在您的自定义字典时,管道标识和诠释文档中能够找到的词条。
- 从RDF文件构建字典和构面树
您可以创建从资源描述框架(RDF)文件中提取的术语字典。例如,你可能从DBpedia RDF文件中提取的条件创造一个化学物质词典。当你部署分析小词典对你的华生Explorer内容分析服务器集合,Watson Explorer内容分析管道诠释这些条款的情况下,在你的文件中发现了这些条款方面。