Watson Explorer 入门(11):配置词典和规则

本文介绍如何在UIMA管道中创建语言资源,如字典和规则,并讲解了这些资源如何帮助分析文本中的特定元素,例如姓名和城市。文章还涵盖了数据库的维护操作,包括同步、复制和导入数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

您可以创建语言资源,如字典和规则,包括在你的UIMA的管道分析文本和感兴趣的项目中,如姓名的城市。

大多数语言资源的源数据存储在数据库中。每个数据库是建立在编译文件中可以使用UIMA管道分析文本和感兴趣的项目注释。每当更新资源时,必须在数据库使用更新的资源分析文档之前,从数据库中重新编译其已编译的文件。

您可以通过导出数据库备份数据库。如果需要,可以从导出的数据库内容创建数据库,例如将数据库复制到另一台计算机。

Tip
Before you can perform the following operations on a dictionary or rules database, you must close the database by right-clicking the database in the Studio Explorer view and clicking Close.

  • Synchronize a database with a source control repository
  • Copy a database
  • Edit properties of a database
  • Import data into a database

词典
内容分析工作室使用多种类型的词典标识文本中的词汇并获取词汇的相关信息。

配置分割规则
配置分割规则词典,可以指示内容分析工作室如何标识文档中的文本。

字符规则
字符规则用于标识文本中特殊的实体,如电话号码、email地址、产品标识等。

解析规则
解析规则标识了文本模式,用于展示我们关心的特殊概念,例如人的名字、公司收购信息等。比如,可以创建标识IBM收购Lotus开发部门的规则。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

许野平

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值