Re17：读论文 Challenges for Information Extraction from Dialogue in Criminal Law

最新推荐文章于 2023-06-27 16:29:55 发布

原创最新推荐文章于 2023-06-27 16:29:55 发布 · 340 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #python #深度学习 #legalAI #信息抽取

人工智能学习笔记专栏收录该内容

277 篇文章

订阅专栏

该博客介绍了2021年ACL会议上的一篇论文，关注从刑事听证会记录中抽取事实信息的任务。研究对比了无监督、弱监督以及预训练模型（如DistilBERT和Longformer）在信息抽取方面的效果。数据集是加利福尼亚州假释听证会的自由形式对话，并针对11个特征进行了部分标注。实验中还涉及了基于Snorkel的无监督方法和使用BERT进行任务特定微调的分类模型。F1值在计算时对Date和numerical特征进行了分箱处理。

诸神缄默不语-个人优快云博文目录

论文名称：Challenges for Information Extraction from Dialogue in Criminal Law
论文ACL官方下载地址：https://aclanthology.org/2021.nlp4posimpact-1.8/

本文是2021年ACL论文，任务是从听证会记录文本中抽取事实信息factual information（11个手动挑选出的特征），分别测试了无监督方法、弱监督方法和使用预训练模型的方法在这一任务上的效果。
数据集是自制数据，是free-form dialogue of California parole hearings，一部分数据被标注了11个特征。

本文使用的算法为：

an unsupervised data programming paradigm extended to weak supervision：无监督 Snorkel，有监督 WSLF（逻辑回归）
pretrained question answering models based on DistilBERT and Longformer：QA1-2
classification models based on BERT each fine-tuned to predict a single task：Task-FT

在这里插入图片描述

F1值在计算时，Date和numerical经过了分箱。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

诸神缄默不语 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。