2021-04-03生产中实体关系抽取一般采用什么方法？

最新推荐文章于 2021-10-21 19:30:13 发布

转载最新推荐文章于 2021-10-21 19:30:13 发布 · 166 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：https://www.zhihu.com/question/264975934

知识图谱专栏收录该内容

62 篇文章

订阅专栏

实体关系抽取在实际生产中，尤其是中小企业，更倾向于使用规则方法，而非复杂的机器学习模型。由于缺乏大量标注数据和对效率的要求，专家制定的规则成为首选。尽管深度学习等先进技术在研究中有优秀表现，但在资源有限的环境下，它们的实际应用并不广泛。

生产中实体关系抽取一般采用什么方法？

实体关系抽取有很多种方法，如基于特征向量的方法，基于核函数的方法，基于Bootstrapping的方法，基于深度学习的方法等等。看了很多这些方面的论文，各自评价不同，都有优缺点，在实际生产环境中，那种方法使用的更多，或者是一种综合使用的关系么？

负责任地告诉你，在实际公司项目（尤其是中小企业），都不是用什么learning-based methods, 而是规则！没错，规则，尤其是特定的领域的任务。

当然了，大厂除外，大厂玩得起。

为什么？你想啊，第一，哪来的大量标注语料？标注数据工作是极其labor-intensive。第二，在under ground的应用上，专家知识制定的规则才是让抽取工作既正确又高效的做法，还简单。第三，即便是用learning models, 拿到一套语料，如果很烂、很不规整，抽取效果拿不出手，实际的项目效果没你实验跑出来的那么好，recall 非常低。

至于你说的state of the art, 在读论文做实验自己跑跑open datasets就好了。

https://www.zhihu.com/question/264975934

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。