泤燃-优快云博客

原创论文综述——Entity-centered Cross-document Relation Extraction

什么是关系抽取（RE）？以往的研究：从同一文本中抽取出的两个实体，分别作为头实体 (Peter Kappesser) 和尾实体 (U.S.) ，然后判别这两个实体之间是效忠关系 (allegiance)。表现形式： (head entity, relation, tail entity) ——> e.g. (Peter Kappesser, allegiance, U.S.)

2023-07-03 20:34:10 812

原创论文综述——DORE: Document Ordered Relation Extraction based on Generative Framework

以往的研究中采用的生成范式是直接生成出对应的词组（lexicon 生成范式），但此类方法不能很好的适应文档级关系抽取。所以现有的生成式文档级关系抽取方法表现不佳，并不是模型能力不足，而是模型训练的范式不足导致的，因此作者提出DORE范式。缺点：失去关系间的部分依赖。如图所示，将所有的实例建模成关系矩阵，其中关系矩阵中的每一个单元格 (i, j) 对应一对实体对 (e_i,e_j) ，计算每种关系的条件概率。关系矩阵：以表填充作为核心解决方式，按照实体出现在文本中的顺序生成关系矩阵，单元格内填充关系。

2023-04-25 13:40:43 786

原创论文综述——UNIRE: A Unified Label Space for Entity Relation Extraction

过构建标签空间来对实体和关系进行联合抽取的方法。实体关系抽取旨在提取文本中的实体并检测它们的实体类型，以及对每个实体对检测它们的关系。作者提出了一种统一标签空间的联合抽取方法——填表法，主要是将实体检测和关系抽取两个子任务放在同一个标签空间中进行处理。针对该方法，提出了一种对应的联合解码算法（Joint Decoding Algorithm），解码出表中的实体和关系。图中词对关系表。将文本表示为二维表结构，它具有更强的表示能力，能将所有的实体和关系都在这张表中完整得表示出来。

2023-01-02 10:04:51 922

原创论文综述——MapRE: An Effective Semantic Mapping Approach for Low-resource Relation Extraction

关系抽取(Relation Extraction, RE)是自然语言处理中的一项基本任务，它旨在发现一个句子中两个实体之间的正确关系。RE问题通常被视为在大规模标注数据上的有监督分类问题。它的缺点是随着关系实例数量的减少，模型性能急剧下降。RE问题经常存在数据不足问题，以往的方法是远程监督(distant supervision)将已有的知识库对应到丰富的非结构化文本数据中，从而生成大量的训练数据，以便训练出一个效果不错的关系抽取器。

2023-01-02 09:34:51 638

原创论文综述——Event-Event Relation Extraction using Probabilistic Box Embedding

事件关系抽取：文本中包含多个事件e1,e2,…,en，识别每个事件对(ei,ej)之间的关系r(ei,ej)子事件(Subevent)关系抽取：{PARENT-CHILD, CHILD-PARENT, COREF, NOREL}事件时序(Temporal)关系抽取：{BEFORE, AFTER, EQUAL, VAGUE}主流的方法都是采用Vector-based的方法，将文本和所有类别标签表征成向量，然后采用Multi-class Classification的方法逐个判断是否属于某个关系类型。

2023-01-02 08:55:01 1222

原创论文综述——TEXT2EVENT: Controllable Sequence-to-Structure Generation for End-to-end Event Extraction

这篇文章主要是介绍提出了一个统一抽取模型，目的是使用单一架构解决不同的信息抽取的任务，所以就提出了这篇文章核心内容：序列到结构网络。对于网络的输出，还提出了按需解码控制特定任务或场景设定下的抽取目标，这一部分就是后面会提到的按需可控生成，使用事件Schema来约束生成空间，这样对于不同的任务不需要改变模型，比如说想要用这个模型训练我们的医疗数据，直接把医疗事件的schema注入进去就可以了。提出该任务还有一个更重要的目的就是想要低成本，也就是低资源学习。

2022-12-31 16:49:29 1115 2

原创论文综述——Unified Structure Generation for Universal Information Extraction

提出了一个统一的text-to-structure的生成框架UIE。设计了结构化抽取语言SEL和结构化模式指导器SSI指导模型对不同的任务生成不同的结构。UIE在监督环境和低资源环境下都取得了非常具有竞争力的性能。

2022-12-14 20:49:35 1809

转载 git——note（二）常用命令

$ git config --global user.name "Your Name"$ git config --global user.email "email@example.com"# 通过git init命令把这个目录变成Git可以管理的仓库：$ git init$ git add [文件名]

2022-04-18 20:06:24 362

原创 pytorch学习笔记三——transformer

pytorch学习笔记三——transformer预备知识代码学习逻辑模型架构机器翻译任务实现主体部分模型构建Encoder-DecoderEncoder部分残差连接和层归一、位置前馈、多头注意力Decoder部分题外话预备知识transformer经典论文：attention is all you need代码学习逻辑从整体到局部关注每一部分数据流向（输入->运算->输出矩阵维度变换）模型架构机器翻译任务实现主体部分import mathimport to

2021-12-10 22:32:57 2557 3

转载 conda创建虚拟环境

1、首先在所在系统中安装Anaconda。可以打开命令行输入conda -V检验是否安装以及当前conda的版本。2、conda常用的命令。1）conda list 查看安装了哪些包。2）conda env list 或 conda info -e 查看当前存在哪些虚拟环境3）conda update conda 检查更新当前conda3、创建python虚拟环境。使用 conda create -n your_env_name python=X.X（2.7、3.6等)命令创建pytho

2021-11-27 15:42:53 50731

原创 pytorch学习笔记二——nn.Module

《神经网络与深度学习》笔记一——机器学习基础

2021-11-26 20:01:34 2016 1

原创一个简单的pytorch模型

1、创建一个全连接层2、传入数据，model作为可调用对象被当做函数调用，并输出返回值y_predict3、源码4、定义一个神经网络的方法1、创建一个全连接层model = torch.nn.Linear(1, 1)2、传入数据，model作为可调用对象被当做函数调用，并输出返回值y_predicty_predict = model(x_data)3、源码class Module(object): # 当子类被当做可调用对象调用时，会调用其重写的forward方法 def __call.

2021-03-24 15:53:25 596

转载神经网络模型提升算法性能的方法

转自：https://machinelearningmastery.com/improve-deep-learning-performance/（英文原文） PS:找了好久，优快云都分类为转载，但是都没写原文地址。提升算法性能的方法列表划分为四块：从数据上提升性能从算法上提升性能从算法调优上提升性能从模型融合上提升性能上述四块的排序对应其对性能的提升能力的排序。文中的想法主要针对...

2021-03-23 20:02:42 2580

原创五种经典卷积神经网络

LeNetAlexNet本文使用六步法分别实现LeNet（1998）、AlexNet（2012）、VGGNet（2014）、InceptionNet（2014）、ResNet（2015）除了卷积网络的“开篇之作”LeNet 以外，AlexNet、VGGNet、InceptionNet 以及 ResNet 这四种经典网络全部是在当年的 ImageNet 竞赛中问世的，它们作为深度学习的经典代表，使得 ImageNet 数据集上的错误率逐年降低。LeNetLeNet 即 LeNet5，由 Yann.

2021-02-21 16:02:21 8828 3

原创 weights.txt文件解说

第一层网络用553的卷积核，一共6个。下面给出了6个卷积核中的所有参数w以下记录了6个卷积核各自的偏置项b，每个卷积核一个偏置b，6个卷积核共有6个偏置b这里记录了BN操作中的缩放因子γ，每个卷积核一个γ，6个卷积核共有6个缩放因子γ这里记录了BN操作中的6个偏移因子β，每个卷积核一个β，6个卷积核共有6个偏移因子β这里记录了第一层全连接网络，共1536行128列的线上权重w，这里记录了第一层全连接网络128个偏置b这里记录了第二层全连接网络，128行10列线上权重w以下记录了第

2021-02-19 19:11:31 965 1

原创 TensorFlow2学习十二之卷积神经网络

一、基本概念1. 全连接NN2. 卷积（Convolutional）3.感受野（Receptive Field）4. 全零填充（padding）二、tensorflow描述卷积层1. keras构建CNN中的卷积层2. 批标准化（Batch Normalization， BN）3. 池化层（Pooling）4. 舍弃（Dropout）5. 构建神经网络三、Cifar101.Cifar10数据集卷积神经网络：借助卷积核提取特征后，送入全连接网络。主要模块：一般包括卷积层、BN 层、激活函数、池化层以及.

2021-02-19 16:54:43 951

原创 TensorFlow2学习十一之绘制准确率acc和损失函数loss曲线

model.fit中将训练集loss、测试集loss、训练集准确率保存了下来history=model.fit(训练集数据, 训练集标签, batch_size=, epochs=, validation_split=用作测试数据的比例, validation_data=测试集, validation_freq=测试频率)history包含以下几个属性：训练集loss： loss测试集loss： val_loss训练集准确率： sparse_categorical_accurac.

2021-01-24 12:05:22 11978 1

原创 TensorFlow2学习十之参数提取

提取可训练参数model.trainable_variables 返回模型中可训练的参数设置print输出格式np.set_printoptions(threshold=超过多少省略显示) # 设置打印效果np.set_printoptions(threshold=np.inf) # np.inf表示无限大print(model.trainable_variables)file = open('./weights.txt', 'w')for v in model.trainable_v

2021-01-24 11:43:26 745

原创 TensorFlow2学习九之存取模型

断点续训可以存取模型读取模型读取模型可以直接使用TensorFlow的load_weights(路径文件名)函数checkpoint_save_path = "./checkpoint/mnist.ckpt"if os.path.exists(checkpoint_save_path + '.index'): model.load_weights(checkpoint_save_path)保存模型保存模型参数可以使用TensorFlow给出的回调函数tf.keras.callbacks

2021-01-24 10:55:15 341

原创 TensorFlow2学习八之数据增强

图像增强：对图像的简单形变。TensorFlow2图像增强函数tf.keras.preprocessing.image.ImageDataGenerator()image_gen_train = tf.keras.preprocessing.image.ImageDataGenerator( rescale = 所有数据将乘以该数值 rotation_range = 随机旋转角度数范围 width_shift_range = 随机宽度偏移量 height_shift_range = 随机高度偏移

2021-01-24 10:32:05 523

原创 TensorFlow2学习七之加载自制数据集

一、自制数据集数据集路径读入数据一、自制数据集数据集路径.\mnist_image_labelmnist_train_jpg_60000和mnist_test_jpg_10000存放训练集和测试集mnist_test_jpg_10000.txt和mnist_train_jpg_60000.txt存放训练集和测试集标签train_path = './mnist_image_label/mnist_train_jpg_60000/' # 训练集图片路径train_txt = './.

2021-01-23 16:57:26 1156

原创 TensorFlow2学习六之构建神经网络

一、搭建神经网络模型tf.keras.models.Sequentialcompile()配置神经网络的训练方法优化器（Optimizer）损失函数（loss）评测指标（Metrics）fit()执行训练过程summary()打印出网络的结构和参数统计复现鸢尾花分类二、class搭建神经网络模型类模块搭建鸢尾花分类一、搭建神经网络模型第一步导入相关模块第二步准备测试集(x_train,y_train)和训练集(x_test,y_test)第三步搭建网络结构model = tf.keras.m.

2021-01-23 15:16:37 416

原创 TensorFlow2学习五之神经网络优化过程

一、常用函数tf.where(条件语句，真返回A, 假返回B)np.random.RandomState.rand(n)np.vstack(数组1, 数组2)np.mgrid[]、x.ravel()、二、神经网络复杂度空间复杂度时间复杂度指数衰减学习率激活函数激活函数输出值的范围Sigmoid函数Tanh函数Relu函数Leaky Relu函数损失函数（loss）均方误差损失函数交叉熵损失函数自定义损失函数一、常用函数tf.where(条件语句，真返回A, 假返回B)条件语句真返回A，条件语句假返回.

2021-01-21 11:55:33 370

原创 TensorFlow2学习四之函数

构建神经网络准备数据：采集大量“特征、标签”数据搭建网络：搭建神经网络结构优化参数：训练网络获取最佳参数应用网络：将网络保存为模型，输入新数据分类或预测结果损失函数（loss function）：预测值（y）与标准答案（y_）的差距。损失函数可以定量判断W、b的优劣，当损失函数输出最小时，参数W、b回出现最优值。...

2021-01-19 18:47:27 197

原创两种方法解决AttributeError: module ‘tensorflow‘ has no attribute ‘placeholder‘

一import tensorflow.compat.v1 as tftf.disable_v2_behavior()替换import tensorflow as tf二如果后面还要继续用tf2版本，就可以只更改一句代码：data_in = tf.compat.v1.placeholder(tf.float32, [None, 100, 100, 3])

2021-01-12 17:06:29 1363 1

原创 git——Note（一）

git——Note（一）安装git安装git

2021-01-02 17:49:01 392

原创 python数据分析练习——姓名分析US_Baby_names_right.csv

第一步:导入相关模块import pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示负号第二步：加载dataset目录下US_Baby_names_right.csv文件数据并查看数据

2020-07-06 18:43:06 2401

原创 python数据分析练习——FoodFacts.csv分析

python数据分析练习——FoodFacts.csv分析导包import numpy as npimport pandas as pdimport datetimeimport matplotlib.pyplot as pltimport seaborn as sns# 正常显示中文标签plt.rcParams['font.sans-serif'] = ['SimHei']# 自动适应布局plt.rcParams.update({'figure.autolayout': True})

2020-07-06 18:04:14 1243

原创时间序列数据分析

时间序列数据分析导包datetime数据转换重采样、降采样、升采样类型使用说明date日期（年、月、日）time时间（时、分、秒、毫秒）datetime日期和时间timedelta两个datetime的差（日、秒、毫秒）txinfo用于存储时区信息的基本类型导包import datetimedatetimedatetime.date(2020, 1, 1)datetime.date(2020, 1, 1)datetime.time(

2020-07-06 17:24:52 850

原创数据分析总结

数据分析总结导包读写查看信息对列操作str操作，类型转换删除del，检测缺失值nunique(),unique()min(),max(),median()resample数据合并value_counts(),groupby(),apply(),map(),agg(),sort_values(),lambda()导包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns#

2020-07-06 10:00:13 742

原创数据可视化总结——matplotlib、seaborn

数据可视化总结——matplotlib、seaborn导包matplotlib基本参数折线图绘制直方图 hist(), plt.bar()绘制水平方向的柱状图饼图散点图箱线图seaborn基本参数直方图和密度曲线图密度曲线图毛毯图散点图catplot()如果需要看清每个数据点，可以使用swarmplot箱线图catplot()散点图矩阵小提琴图条形图使用catplot()使用条形显示每个分箱器中的观察计数countplot多变量图用双变量和单变量图绘制两个变量的图。回归图导包import numpy a

2020-07-06 09:52:43 1692

cifar10_lenet5.py

cifar10.py

mnist_numpy.ipynb

class_mnist.rar

RNN_stock.rar

rnn_embedding_1.py

rnn_onehot_1.py

cifar10_alexnet8.py

cifar10_inception10.py

cifar10_resnet18.py

cifar10_vgg16.py

空空如也