自然语言处理中的信息提取高级任务
1. 实体链接(NEL)
实体链接(NEL)是一项比文本表示、文本分类、命名实体识别(NER)和关键词提取(KPE)更专业的自然语言处理任务。它需要一个大型的带注释数据集以及某种百科全书式的资源来进行链接。在实际应用中,使用像 IBM(Watson)和 Microsoft(Azure)等大公司提供的现成的按使用付费服务来进行实体链接更为常见,而不是开发内部系统。
1.1 使用 Azure API 进行实体链接
Azure 文本分析 API 是用于实体链接的流行 API 之一,DBpedia Spotlight 也是一个免费可用的工具。以下是使用 Azure API 对文本进行实体链接的代码示例:
import requests
my_api_key = 'XXXXXXX'
def print_entities(text):
url = "https://westcentralus.api.cognitive.microsoft.com/text/analytics/\
v2.1/entities"
documents = {'documents':[{'id':'1', 'language':'en', 'text':text}]}
headers = {'Ocp-Apim-Subscription-Key': my_api_key}
response = requests.post(url, headers=headers, json=documents)
entities = response.jso
超级会员免费看
订阅专栏 解锁全文
9684

被折叠的 条评论
为什么被折叠?



