
自然语言处理
文章平均质量分 62
Tina Tang
读万卷书,行万里路!
展开
-
2021-10-28又又又折腾了一下
1.创建新的conda环境 下载:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 版本对应:python3.7 对应conda3.5.02.安装tensorflow2.3 pip install tensorflow-cpu==2.3.0 -i https://pypi.douban.com/simple/ 其它参考:https://www.bilibili.com/read/cv7175664 ...原创 2021-10-28 16:31:31 · 506 阅读 · 0 评论 -
词的向量化表示(整理集合)
1.吾爱NLP(5)—词向量技术-从word2vec到ELMo - 简书 (jianshu.com)2.根据李宏毅老师2019最新的机器学习视频整理视频地址:https://www.bilibili.com/video/av46561029/?p=61ppt下载地址:http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML19.html3.ELMO、BERT、GPT视频笔记整理_腾讯新闻 (qq.com)"词、句子甚至是文章的嵌入已成为所有基于转载 2021-10-11 08:45:39 · 2615 阅读 · 0 评论 -
知识图谱补全:Triple Classification(三元组分类)
6) Triple Classification: Triple classification is to determinewhether facts are correct in testing data, which is typicallyregarded as a binary classification problem. The decision ruleis based on the scoring function with a specific threshold.Aforeme翻译 2021-06-09 13:57:07 · 4219 阅读 · 5 评论 -
(知识图谱补全)Meta Relational Learning元关系学习
The long-tail phenomena existin the relations of knowledge graphs. Meanwhile, the real-worldscenario of knowledge is dynamic, where unseen triples areusually acquired. The new scenario, called as meta relationallearning or few-shot relational learning,.翻译 2021-06-09 11:41:26 · 1000 阅读 · 0 评论 -
《知识图谱概念与技术》读书笔记:关系抽取中基于学习的抽取
1.基于学习的关系抽取分类:2. 基于远程监督学习的关系抽取2009年,Mintz等人首次提出将远程监督的思想用于关系抽取。远程监督是一种利用外部知识对目标任务间接实现监督的过程。远程监督的基本假设:给定一个三元组<s,r,o>,则任何包含实体对<s,o>的句子都在某种程度上描述了该类实体对之间的关系。因此,可以将包含实体对的句子作为正例。为某个关系自动标注样本的过程: 1、...原创 2021-01-13 15:34:44 · 278 阅读 · 0 评论 -
《知识图谱概念与技术》读书笔记:关系抽取中基于模式的抽取
读完可以回答以下问题:1. 基于模式的关系抽取定义是什么?2.基于模式的关系抽取方法及各自的优缺点有哪些?3.基于模式的关系抽取的质量评估方式有哪些?1.基于模式的关系抽取通过定义在文本中表达的字符、语法或者语义模式,将模式与文本的匹配作为主要手段,来实现关系实例的抽取。2.基于模式的关系抽取可以分为: 来自于专家定义的模式: 优缺点:质量精良,抽取准确率高。但是成本高昂,召回率低。 1)基于字符的模式: 表达特定关系的字...原创 2021-01-12 14:22:11 · 1010 阅读 · 0 评论 -
《知识图谱概念与技术》读书笔记:关系抽取
读完可以回答以下问题:1. 什么是关系抽取2.关系抽取的方法有哪些?3.常用的关系抽取的数据集有哪些?4.关系抽取的评估方法有哪些?5.常用的关系抽取的评估指标是什么?1.定义:关系抽取(Relation Extraction)就是抽取实体之间的关系实例,产生的结果是三元组<主体(Subject),谓词(Predicate),客体(Object)>。它是信息抽取的子任务之一,也是知识图谱构建最重要的的子任务之一。2. 关系抽取的方法3.关系抽取常用的数据集原创 2021-01-12 11:47:41 · 534 阅读 · 0 评论 -
《知识图谱概念与技术》读书笔记:isA关系补全
读完可以回答以下问题:1. isA关系缺失的常见原因有哪些?2.常用的isA关系补全方法有哪些?如何进行补全?3.概念图谱中的错误成因有哪些?如何纠正?人类知识浩如烟海,知识表达不完备是常见的问题。知识图谱的不完备问题也是一个普遍问题。为了让知识图谱能够更好地落地,知识图谱补全将是一个需要被学者普遍重视的问题。概念图谱作为知识图谱中的一种,专注于isA关系。因此,概念图谱补全中最重要的问题就是isA关系补全。1. isA关系缺失的常见原因有哪些?2.常用的isA关系补全方法有原创 2021-01-11 10:24:38 · 1267 阅读 · 0 评论 -
《知识图谱概念与技术》读书笔记:概念图谱中的isA关系
读完可以回答以下问题:1.概念图谱构建的要素是什么?如何构建优质的概念图谱?2.概念图谱中isA关系的抽取方法有哪些?实际应用较多的方法有哪些?实际应用时抽取过程是怎样的?3.中文概念图谱的构建过程是怎样的?典型的中文概念图谱实例介绍1.概念图谱构建的要素是什么?如何构建优质的概念图谱?知识图谱的规模和质量是构建知识图谱的重要因素。概念图谱作为一种重要的知识图谱也是如此。如何构建大规模且高质量的概念图谱呢?从大规模的文本中自动抽取isA关系,进而构建大规模概念图谱。如何提高质原创 2021-01-10 19:47:45 · 4999 阅读 · 0 评论 -
《知识图谱概念与技术》读书笔记:概念图谱
读完可以回答以下问题:什么是概念图谱?有哪些概念图谱?概念图谱有什么价值和应用?1.什么是概念?从计算机信息的角度,概念是对某个形态的数据输入产生符号化概念输出的过程。2.什么是概念图谱?如何分类?概念图谱(Concept Graph)是一类专注于实体和概念之间的isA关系的知识图谱。从语言和认知两个角度,概念和图谱可以划分为 1)概念层级体系 (Taxonomy) 包括三种元素:实体 、概念 和 isA关系 ...原创 2021-01-08 16:32:33 · 1051 阅读 · 0 评论 -
ubuntu的一些操作
ubuntu安装好后,root初始密码(默认密码)不知道,需要设置。一、root密码重置1、先用安装时候的用户登录进入系统2、输入:sudo passwd 按回车3、输入新密码,重复输入密码,最后提示passwd:password updated sucessfully此时已完成root密码的设置4、输入:su root切换用户到root二、安装dockerhttps://blog.youkuaiyun.com/qq_42845260/article/details/8372208.原创 2020-10-17 09:17:13 · 249 阅读 · 0 评论 -
华东理工大学王昊奋博士VAG小组学术报告
2014年11月28号,来自华东理工大学的王昊奋博士来vag小组做学术报告。报告的题目是《Knowledge Graph 101-from the persperctive of engineers》。主要的内容是关于知识图谱和语义网络的相关内容。在报告中主要介绍了知识图谱的相关的概念以及非常多的openSource的工具。下面是主要的openSource的工具链接关于结构化数据的Schema :一个提供了可以供搜索引擎识别的语义标记的网站。 Web Data Commons : 一个从Commo转载 2020-05-23 18:09:17 · 407 阅读 · 0 评论 -
知识图谱的架构
知识图谱的架构知识图谱的架构包括自身的逻辑结构以及构建知识图谱所采用的技术(体系)架构。知识图谱的逻辑结构知识图谱在逻辑上可分为模式层与数据层两个层次,数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储。如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储介质,例如开源的Neo4j、Twitter的FlockDB、sones的GraphDB等以及中科天玑自主研发的Golaxy Graph。模式层构建在数据层之上,是知识图谱..转载 2020-05-14 11:26:02 · 5988 阅读 · 0 评论 -
本体、语义网络和知识图谱的概念与区别
随着科技的不断发展,数据的不断累积,催生了新时期的知识工程。本体、语义网络和知识图谱都是近期不同的知识工程的载体,作为知识管理模型已经被广泛应用在人工智能及知识工程领域,在知识共享、知识推理和智能辅助策略等方面发挥着重要作用。1.关于1990-2000年代的本体介绍2.关于2000-2006年语义Web介绍3.关于知识图谱的介绍一张图了解本体,语义网络和知识图谱...原创 2020-05-11 11:47:53 · 11586 阅读 · 0 评论 -
图卷积网络GRAPH CONVOLUTIONAL NETWORKS
GRAPH CONVOLUTIONAL NETWORKSTHOMAS KIPF, 30 SEPTEMBER 2016https://tkipf.github.io/graph-convolutional-networks/带一阶滤波器的多层图卷积网络Overview综述Many important real-world datasets come in the form ...翻译 2020-01-09 16:51:29 · 3054 阅读 · 0 评论 -
事件抽取的那些重要文章
使用神经网络进行事件抽取:1.Event Detection and Domain Adaptation with Convolutional Neural Networks2.Event extraction via dynamic multi-pooling convolutional neural networks3.Joint event extraction via re-c...原创 2019-12-04 10:56:45 · 294 阅读 · 0 评论 -
ACE 2005数据集(介绍2)
以下内容来自https://catalog.ldc.upenn.edu/LDC2006T06ACE 2005 Multilingual Training CorpusACE2005多语言训练语料Item Name: ACE 2005 Multilingual Training Corpus Author(s): Christopher Walker, Stephanie...翻译 2019-04-10 11:03:18 · 15682 阅读 · 16 评论 -
ACE 2005 Data Prep 数据预处理
以下内容来自https://github.com/mgormley/ace-data-prepACE 2005 Data PrepACE 2005数据预处理Description描述This project ties together numerous tools. It converts from theACE 2005 file format(.sgm and .a...翻译 2019-04-10 17:01:15 · 3372 阅读 · 23 评论 -
ACE 2005数据集(介绍1)
以下内容来自CMU的William Cohen小组(http://curtis.ml.cmu.edu/w/courses/index.php/ACE_2005_Dataset)The ACE 2005datasetaddresses five primary tasks – the recognition of entities, values, temporal expression...翻译 2019-04-10 09:49:18 · 8038 阅读 · 19 评论 -
深度学习的一般性流程1-------PyTorch搭建深度学习模型
深度学习的一般性流程:1. 构建网络模型结构2. 选择损失函数3. 选择优化器进行训练PyTorch搭建深度学习模型主要包括2种方法:1. 继承torch.nn.Module, 自己构造深度模型class SimpleNet(torch.nn.Module): def __init__(self, n_features,n_hidden,n_output)...原创 2019-04-18 14:57:36 · 1334 阅读 · 0 评论 -
深度学习之——循环神经网络RNN及其变形LSTM,GRU
1. 什么是循环神经网络?基于记忆模型的想法,记住前面出现的特征,并依据特征推断后面的结果,并且整体的网络结构不断循环,因此得名循环记忆网络。RNN(Recurrent Neural Network)是一类用于处理序列数据的神经网络。常见的序列数据如语音、文本等,这类数据处理时需要依赖时间和记忆力。百度百科词条:时间序列数据是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等...原创 2019-04-23 14:54:50 · 2288 阅读 · 0 评论 -
深度学习之——卷积神经网络CNN
1. 什么是卷积神经网络卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一2.卷积神经网络的历史最有代表性的LeNet-5是由卷积层、池化层、全连接层的顺序连接组成。2012年的AlexN...原创 2019-04-23 15:10:58 · 2801 阅读 · 0 评论 -
Stanford Named Entity Recognizer (NER) 斯坦福命名实体识别(NER)
以下翻译内容来自:https://nlp.stanford.edu/software/CRF-NER.htmlAbout关于Stanford NER is a Java implementation of a Named Entity Recognizer. Named Entity Recognition (NER) labels sequences of words in a te...翻译 2019-04-28 10:43:18 · 5697 阅读 · 1 评论 -
深度学习的一般性流程2-------PyTorch选择损失函数
深度学习的一般性流程:1. 构建网络模型结构2. 选择损失函数3. 选择优化器进行训练【背景----百度百科给出的基本概念】最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。监督学习中,如果预测的变量是离散的,我们称其为分类(如决策树,支持向量机等),如果预测的变量是连续的,我们称其为回归。一元线性模型:回归分析中,如果...原创 2019-04-19 08:55:59 · 528 阅读 · 0 评论 -
深度学习的一般性流程3-------PyTorch选择优化器进行训练
深度学习的一般性流程:1. 构建网络模型结构2. 选择损失函数3. 选择优化器进行训练梯度下降法(gradient descent)是一个最优化算法,常用于机器学习和人工智能当中用来递归性地逼近最小偏差模型。torch.optim.SGD 是随机梯度下降的优化函数梯度下降(Gradient Descent)方法变种:(full) Batch gradient desce...原创 2019-04-19 09:08:42 · 556 阅读 · 0 评论 -
Python的pandas什么鬼,不会数据库也没有关系啊!操作起来效率也超级超级高~
【百度百科】pandas 是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。勤快人的翻译:https://blog.youkuaiyun.com/jiangjian...原创 2019-05-04 09:13:06 · 742 阅读 · 0 评论 -
深度学习——自编码器
无监督学习(Unsupervised learning)是机器学习的一种方法,是指从无标签的数据中学习出一些有用的信息或模式。应用广泛:现实世界中的数据都是无标签的目的:将纷繁复杂的数据归类,进而分类管理典型应用:电商、银行等行业对不同类型客户定向营销无监督特征学习(Unsupervised Feature Learning)是从无标签的数据中挖掘有效地特征或表示,从而帮助后...原创 2019-05-05 16:01:55 · 2132 阅读 · 2 评论 -
Bert应用
Bert应用 摘自https://zhuanlan.zhihu.com/p/68446772第一,如果NLP任务偏向在语言本身中就包含答案,而不特别依赖文本外的其它特征,往往应用Bert能够极大提升应用效果。第二,Bert特别适合解决句子或者段落的匹配类任务。就是说,Bert特别适合用来解决判断句子关系类问题,这是相对单文本分类任务和序列标注等其它典型NLP任务来说的,很多实验结果表...转载 2019-06-11 10:39:11 · 1223 阅读 · 0 评论 -
注意力机制
刚刚学习注意力机制,得到了大神的帮助,才能短时间get到点大神的博客地址奉上https://www.cnblogs.com/robert-dlut/p/8638283.htmlhttps://www.cnblogs.com/robert-dlut/p/5952032.html剑神不用说了啦博客无比给力https://kexue.fm/archives/4765还有以下的这些...原创 2019-07-12 14:24:52 · 143 阅读 · 0 评论 -
NLP顶会和国内外重量级研究团队
会议( C ):ACL (Annual Meeting of the Association for Computational Linguistics) 国际计算语言学会2019http://acl2019.org/2018https://acl2018.org/2017http://acl2017.org/2016https://aclweb.org/anthology...原创 2019-07-24 14:32:12 · 2938 阅读 · 0 评论 -
[转载]事件、事件抽取与事理图谱
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.youkuaiyun.com/lhy2014/article/details/85806973事件、事件抽取与事理图谱人类社会是一个静态事物进行动态活动所创造形成的世界,人类的命题记忆是以“事件”为存储单位的,存储的是组成事件的概念及其之间的关系以及事件及...转载 2019-09-25 15:03:50 · 734 阅读 · 0 评论 -
自然语言处理☞WordNet
WordNet is a lexical database for the English language.It groups English words into sets of synonyms called synsets,provides short definitions and usage examples, and records a number of relations amo...翻译 2018-11-08 06:29:28 · 584 阅读 · 0 评论