
A关系抽取
文章平均质量分 68
腾云丶
这个作者很懒,什么都没留下…
展开
-
论文笔记:A Novel Use of Statistical Parsing to Extract Information from Text Integrated Sentential Proce
这篇论文发表的比较早,发表于2000年,属于信息抽取的传统方法。 一、文章要解决的问题 解决文本信息抽取问题,主要用于两个公开的信息抽取任务 MUC-7(The senven Message Understanding Conference) TE(The Template Element) 二、文章使用的方法(亮点、创新点) 词汇化、概率上下文无关语法程序,使用的treeba...原创 2018-05-29 19:02:11 · 1661 阅读 · 0 评论 -
论文笔记(9):Large Scaled Relation Extraction with Reinforcement Learning
论文笔记:Large Scaled Relation Extraction with Reinforcement Learning 一、解决的问题 远程监督数据集中的句子并不直接标记,并且并非所有提及实体对的句子都可以表示它们之间的关系。例如, [Obama]e1[Obama]e1[Obama]_{e_1} was born in the United [States]e2...原创 2018-07-15 22:04:04 · 2332 阅读 · 0 评论 -
论文笔记8:Distant Supervision for Relation Extraction beyond the Sentence Boundary
论文笔记:Distant Supervision for Relation Extraction beyond the Sentence Boundary 第一次提出应用远程监督跨句子关系抽取,文章发表于2016年 一、解决得问题 现有得远程监督关系抽取只从单句中抽取。跨句子抽取在有监督学习中已经有所研究,但利用远程监督得还没有。 二、方法和过程 2.1 思想 采用文档级图表示...原创 2018-07-03 22:35:42 · 2439 阅读 · 0 评论 -
论文笔记7:Simple Algorithms for Complex Relation Extraction with Applications to Biomedical IE
论文笔记:Simple Algorithms for Complex Relation Extraction ·1234with Applications to Biomedical IE 提出将多元关系抽取转化为二元关系抽取,应用到的是一个句子,但作者提出扩展到跨句子抽取很容易。本文发表于2005年,属于早期论文。 一、论文要解决的问题 生物医学数据的快速发展,让利用计算机技术提取有用信息...原创 2018-06-30 13:30:10 · 1330 阅读 · 0 评论 -
论文笔记6:Distant supervision for relation extraction without labeled data
提出远程监督,从缺少标签的数据中抽取二元关系 一、论文要解决的问题 对于ACE等抽取任务,关系抽取的经典模型是基于监督学习的算法。此片论文提出了一种不依赖标签数据的算法,降低了对数据集的依赖,尤其适合于大规模数据集合抽取。 1.1 机器学习方法存在的问题 在有监督机器学习方法中,首先需要人工标注句子中的实体和他们之间的关系。例如在ACE任务中,提供的数据集里包括1000多分文档,每个...原创 2018-05-29 19:09:15 · 5315 阅读 · 0 评论 -
论文笔记5:Integrating Probabilistic Extraction Models and Data Mining to Discover Relations and Patterns
使用条件随机场抽取信息,抽取实体间的二元关系 一、论文要解决的问题 在信息抽取系统中,为了获得较好的性能,必须包含数据本身固有的关系模式,但是手工编写这些规则费时费力俄而且不可能编写全部规则。而且数据中存在一些隐藏的关系模式,这对提供信息抽取性能很有帮助。 二、论文使用的方法和亮点 2.1 亮点 提出一个集成机器学习模型,能够学习上下文关系和关联关系模式来抽取实体之间的关系,并使用线性...原创 2018-05-29 19:08:23 · 1501 阅读 · 0 评论 -
论文笔记4:生物医学语义关系抽取研究综述
论文中需要看完学习得知识 N-gram理论 值得看得论文 Liu 2016 使用CNNs进行药物-药物相互作用关系抽取,没有大量人工定义特征 Etzioni2008 将关系抽取方法定义为三类:基于知识、有监督和无监督 Zhou2014将关系抽取分为两类:基于知识(依赖资源和预定义模式)和机器学习(基于良好定义得特征) Miwa(2009) 使用一个丰富得特征集合,抽取蛋白质相互作用关系...原创 2018-05-29 19:06:19 · 1837 阅读 · 4 评论 -
论文笔记3:Extracting Relations with Integrated Information Using Kernel Methods
该论文发表于2005年,属于早期论文 一、论文要解决的问题 从文本中的成对实体之间抽取存在的关系 二、文章使用的方法(亮点、创新点) 使用核方法,并多个核融合在一起,组合了多个不同的语法处理的特征 语法处理 词语切分(tokenization) 句子解析(sentence parsing) 深度依赖关系分析(deep dependency analysis) 处理的任务 20...原创 2018-05-29 19:05:27 · 1463 阅读 · 0 评论 -
论文笔记2:Combining Lexical, Syntactic, and Semantic Features with Maximum Entropy Models for Extracting
这篇论文发表于2004年,属于比较早期的论文,主要解决提取实体之间的语义关系问题。 一、文章要解决的问题 解决实体之间的语义关系问题,在the Automatic Content Extraction (ACE) evaluation中获得了非常好的结果。 二、文章使用的方法(亮点、创新点) 解决传统方法主要基于语法解析树,增强语法解析树(Miller et al., 2000 )问题...原创 2018-05-29 19:04:03 · 2615 阅读 · 0 评论 -
论文笔记:Comparing CNN and LSTM character-level embeddings in BiLSTM-CRF models for chemical and disease
主要工作 主要目标是生物医学、化学和疾病命名实体识别,基于原来的CNN和LSTM模型加了字符向量。CNN训练速度更快,因为参数更少。 数据集 BioCreative VCDR corpus (Li et al., 2016). 1000篇手工标注的摘要用于训练和验证,大概9193条句子 500偏手工标注的摘要用于测试,大概4840条句子 也用到了一个预处理过的此数据集版本,提供了POS-,ch...原创 2019-07-12 11:40:59 · 621 阅读 · 0 评论