Unsupervised Keyphrase Extraction via Interpretable Neural Networks 阅读笔记

无监督关键词抽取:可解释神经网络方法
本文介绍了Unsupervised Keyphrase Extraction via Interpretable Neural Networks,由卡内基梅隆大学和太平洋西北国家实验室的研究人员提出。该模型(INSPECT)通过解释文本分类器的决策来抽取关键词,以捕捉文档中的多种主题。模型包含两部分:基础可解释模型和关键词相关性模型。它旨在克服传统无监督方法的局限性,如领域依赖和新词处理问题。该工作为关键词抽取提供了新的视角,强调了预测文本主题的重要性。

Unsupervised Keyphrase Extraction via Interpretable Neural Networks 阅读笔记

论文简单介绍

  • 题目 Unsupervised Keyphrase Extraction via Interpretable Neural Networks
  • 作者 Rishabh Joshi Vidhisha Balachandran Emily Saldanha
  • 单位 Language Technologies Institute, Carnegie Mellon University,Pacific Northwest National Laboratory
  • 时间 2022
  • 期刊 arXiv

动机

  • 以前的无监督方法主要是通过嵌入相似性或图中心性来求助于短语重要性的启发式概念,需要广泛的领域专业知识来开发它们,这就会导致泛化性不好,不能处理新词发现
  • 作者从另一个角度看关键词抽取:对预测文本主题最有用的短语是重要的关键短语
    • 具体从下图展示出来。文档中的文本通常涵盖有关多个主题的内容。 一套全面的关键词,应该突出所有主要主题的重要短语。

在这里插入图片描述

模型

作者提出了INSPECT模型,用来在长文本中抽取关键词。假设神经文本分类器潜在地利用重要的关键词来预测文本中的主题,INSPECT 通过解释分类决策来提取关键词

因此模型主要分成两个部分,Base Interpretable ModelKyphrase Relevance Model。如下图所示
在这里插入图片描述

  • 首先是常规的分词和词性标注,然后通过词性规则筛选出候选关键词
  • 他这里处理长文本的方法是将长文本分段送进去RoBERTa里面进行嵌入学习
  • 局部可解释层主要采用一个激活差异函数。这块自己也没有弄清楚

该文后续再更新,目前只是简单粗略看一遍,没有深究细节

我的思考

  • 这个可解释性主要是说一个文章应该有多个主题,然后抽取的候选关键词应该包括每一个主题,这个感觉还是主题聚类的东西。他只是换了一个说法而已
关于论文《InvaSpread: Unsupervised Embedding Learning via Invariant and Spreading Instance Feature》的下载地址,我不能直接提供或推荐盗版资源链接。但如果你希望获取这篇论文,以下是一些合法且有效的方式: ### 推荐获取方式: 1. **Google Scholar** 访问 [https://scholar.google.com](https://scholar.google.com),搜索论文标题: ``` InvaSpread: Unsupervised Embedding Learning via Invariant and Spreading Instance Feature ``` 查看是否有作者上传的 PDF 或预印本(如 arXiv)。 2. **arXiv** 访问 [https://arxiv.org](https://arxiv.org),搜索论文标题,查看是否在 arXiv 上有公开版本。 3. **CVPR 官网(或会议官网)** 如果该论文是发表在 CVPR、ICCV、ECCV 等会议,可以访问会议官网查看该年论文列表。 4. **ResearchGate** 访问 [https://www.researchgate.net](https://www.researchgate.net),搜索论文或作者,可请求作者发送论文 PDF。 5. **联系作者邮箱** 如果你知道作者的邮箱(通常论文第一页会有),你可以礼貌地写邮件请求论文副本,例如: ``` Subject: Request for a copy of your paper "InvaSpread" Dear Prof. [Author's Name], I hope this message finds you well. I am very interested in your paper "InvaSpread: Unsupervised Embedding Learning via Invariant and Spreading Instance Feature" and would like to request a copy for personal study. Thank you very much for your time and consideration. Best regards, [Your Name] ``` 6. **使用 Libgen(合法用途)** 如果你所在机构无法访问,可以通过 Library Genesis(https://libgen.is)搜索论文标题或 DOI,但请注意遵守你所在国家的版权法律。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值