知识图谱研究报告-电子版-20191120
- 在大数据环境下,从互联网开放环境的大数据中获得知识,用这些知识提供智能服务互联网/行业,同时通过互联网可以获得更多的知识。这是一个迭代的相互增强过程,可以实现从互联网信息服务到智能知识服务的跃迁。
- 王海勋被引用量最高的论文是 2003 年在 KDD 会议上发表的“Mining concept-drifting data streams using ensemble classifiers”。这篇论文提出了一个使用加权集合分类器挖掘概念漂移数据流的一般框架,经过实验证实该篇论文中所提出的方法在预测精度方面具有优于单分类器方法的显著优势,并且集合框架对于各种分类模型是有效的。
- 唐杰的高引用论文是 2008 年在 KDD 会议上发表的“ArnetMiner: extraction and mining of academic social networks”对其负责的知识工程实验室 ArnetMiner 系统关键问题进行讨论,整合来自在线 Web 数据库的出版物并提出一个概率框架来处理名称歧义问题,除此之外,该篇论文还描述了系统的体系结构和专家画像的主要特征,提出系统应用方法的实证评估。
- 韩家炜的高引用论文是 2000 年在 SIGMOD 会议上发表的“Mining frequent patterns without candidate generation”提出了一种全新的、可以用于数据的存储压缩的、关于频繁模式关键信息的频繁模式树结构,并开发一种有效的基于频繁模式树结构(FP 树结构)的挖掘方法 FP-growth,用于通过模式片段增长挖掘整套频繁模式。
- Ralph Grishman 的高引用论文“A maximum entropy approach to named entity recognition”介绍了一种新的统计命名实体(即“专有名称”)识别系统,称为“MENE”。命名实体(NE)识别是一种信息提取形式,将文档中的每个单词分类为人名、组织、位置、日期、时间、货币价值、百分比或“以上都不是”。对互联网搜索引擎、机器翻译、文档的自动索引以及作为更复杂的工作的基础具有特别重要的意义。
- 周国栋高引用论文是 2002 年在 ACL 上发表的“Named entity recognition using an HMM-based chunk tagger”提出了一种隐马尔科夫模型和一种基于该模型的模块标记器,从中建立了一个命名实体识别系统用于识别并分类名称、时间与数量。
- 黄萱菁的高引用论文是 2009 年在 EMNLP 上发表的“Phrase dependency parsing foropinion mining”提出了一种从产品评论中挖掘挖掘意见的新方法,这种方法将意见挖掘任务转换为识别产品特征、意见表达和它们之间关系,通过多种产品的特征是基于短语所观察的特点引入了短语依赖性解析的概念,将传统的依赖性解析扩展到短语级别,然后实现了该概念以提取产品特征和意见表达之间的关系,经过实验评估表明挖掘任务可以受益于该种方法的短语依赖性解析。
- Renée J. Miller 的代表性论文是 2003 年在 ICDT 上发表的“Data Exchange: Semantics and Query Answering”给出了一个代数规范,这种规范代表了可能解决方案的整个空间从而使其在数据交换问题的所有解决方案中能够选择通用的特殊解决方案作为问题的解决方法。
- Felix Naumann 的高引用论文是 2005 年在 ICDE 上发表的“Schema Matching Using Duplicates”展示了利用数据集中重复项的存在来自动识别匹配的属性,论文中介绍的算法能够通过比较重复记录中的数据识别相应的属性,经过验证已经证实了该方法的有效性。
- Roberto Navigli 2013年在ACM上发表的论文的高引论文“BabelNet: The automatic construction,evaluation and application of a wide-coverage multilingual semantic network”,提出了构建BabelNet的自动方法,一个覆盖广泛的大型多语言语义网络。
- Diego Calvanese 的高引用论文是 2007 年发表的“Tractable Reasoning and Efficient Query Answering in Description Logics: The DL-Lite Family”提出了一个新的专门用于捕捉本体语言同时保持低推理复杂度的描述逻辑系列 DL-Lite。
- Sören Auer2007 年发表于 ISWC 的“DBpedia: a nucleus for a web of open data”和 2009年发表的“DBpedia - A crystallization point for the Web of Data”介绍了 DBpedia 的工作原理。
- 孙茂松的高引论文是 2018 年发表于 AAAI 的“Neural Knowledge Acquisition via Mutual Attention Between Knowledge Graph and Text”,提出了一个关于知识获取的通用联合表示框架,用于知识图完成(KGC)和文本关系提取(RE)这两个任务。