- 博客(22)
- 资源 (2)
- 收藏
- 关注
原创 基于pytorch+transformers的NER实体识别
命名实体识别作为一项基础的NLP任务,其用在信息抽取、关系抽取、图谱构建等任务中都作为基础存在
2022-07-06 10:36:14
2127
原创 NLP实用工具
在做NER实体识别时,经常会遇到将BIO等格式的标注或者预测数据转成brat等json格式,反之将brat等json格式(各类比赛中采用格式)转成BIO格式进行模型训练也是常常遇到的,下面给出开箱即用的函数工具。...
2022-07-04 16:04:40
343
原创 活体检测技术
活体检测技术应用场景金融支付,门禁,打卡机等应用场景。任务目标为判断捕捉到的人脸是真实人脸,还是伪造的人脸攻击。任务难点主要是:攻击源分布过于广泛不同攻击源之间差距不明显使用场景限制检测方法当前开放样本数据不足2019世界黑帽安全大会,腾讯公司演示了攻破苹果Face ID。工具为:一款特制眼镜,眼镜镜片上贴有黑色胶带,黑色胶带中心还贴有白色胶带。《福布斯》的记者们决定使用 3D 打印石膏人脸攻击手机的人脸识别功能。 在一通测试之后,他们发现石膏人脸竟可以破解当时四种流行旗舰手机(LG G
2022-05-21 18:12:21
1562
原创 深度学习(一、入门)
从人工智能开始让机器具有人类的智能,能够理解人类语言、语音、图片、视频以及各种人类活动数据,并以此为依托辅助甚至代替人类做出决策,是人工智能的终极目标。最早提到机器智能的是图灵,1950年,他提出机器是否拥有智能的测试方法为:一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答。如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么就可以认为这个计算机是智能的,而该测试也称为图灵测试。1956年的达特茅斯(Dartmouth)会议。在这次会议上,“人工智能”...
2022-05-21 16:15:17
1718
原创 From TextCNN to Sentence Similarity(句子分类到表征)
TextCNN basic基础知识自动提取文本的特征,将sentence进行分词,组成每个句子的词,每个词对应一个id,(也可以不分词,以字为粒度)并将词转化为id,每个句子都是id组成的数据,将所有的句子都padding到最长的句子max_len_stence,也可以设置一个值为句子长度值。然后进行embedding,每个id对应一个size的词向量,这样每个句子的presentation即为[max_len_stence,size],到此也就完成了embedding,后面类似图像的卷积和池化提取句子
2022-05-17 15:01:52
262
原创 深度学习(五、注意力机制与强化学习以及目前主要应用)
注意力机制由于优化算法和计算能力的限制,神经网络在实践中很难达到通用近似的能力。网络不能太复杂(参数太多)。为了提高网络的能力,分别采用了一些措施,如局部连接、权重共享、汇聚操作等。简单循环神经网络存在长期依赖问题,( LSTM网络)引入一个近似线性依赖的记忆单元来存储远距离的信息。记忆单元的存储能力和其大小相关。如果增加记忆单元的大小,网络的参数也随之增加。大脑中的注意力:人脑每个时刻接收的外界输入信息非常多,包括来源于视觉、听觉、触觉的各种各样的信息。但就视觉来说,眼睛每秒钟都会发送千万比特的信息给
2022-05-16 20:46:16
2275
原创 深度学习(四、循环神经网络RNN)
前馈网络的一些不足连接存在层与层之间,每层的节点之间是无连接的。(无循环)输入和输出的维数都是固定的,不能任意改变。无法处理变长的序列数据。假设每次输入都是独立的,也就是说每次网络的输出只依赖于当前的输入。循环神经网络循环神经网络通过使用带自反馈的神经元,能够处理任意长度的序列。循环神经网络比前馈神经网络更加符合生物神经网络的结构。循环神经网络已经被广泛应用在语音识别、语言模型以及自然语言生成等任务上。h(t)=f(h(t−1),x(t))h(t) =f(h(t-1), x(t))
2022-05-16 19:59:29
489
原创 深度学习(三、卷积神经网络CNN)
引入原因前文提到过理论上一个两层的全链接神经网络即可拟合任意的函数,那为何还要引入CNN呢?主要是全连接网络的权重矩阵的参数非常多,其想要拟合任意的函数神经元必须非常大,运算量也就特别多,现在主流观点为将深度神经网络做得比较深,有理论支持拟合同样复杂的函数,在深度上发展所需要的神经元比横向发展所需要的神经元更多,因为深层能够捕获到高层的语义特征。卷积神经网络主要依靠局部连接与权重共享达到其减少运算,保留强表征的效果。卷积操作卷积操作作为常用的特征提取器,以图片特征为例:不同的滤波器(卷积核)可
2022-05-15 18:15:48
330
原创 深度学习(二、全连接网络FNN)
在前馈神经网络中,各神经元分别属于不同的层。整个网络中无反馈,信号从输入层向输出层单向传播,可用一个有向无环图表示。为了引入非线性变换(因为如果没有非线性变换,即使层数再多也只是做了一些仿射函数而已),在各个层中可能会引入一些激活函数(如sigmonid激活函数将值域映射到0~1,tanh激活函数将值域映射到-1~1。)这个设计初衷最开始是模仿人脑神经元的想法(其实关联并不是特别大),细胞体中的神经细胞膜上有各种受体和离子通道,胞膜的受体可与相应的...
2022-05-15 17:38:58
1577
原创 强人工智能:GPT3?
GPT3问世已经半年之久了,GPT3模型在刚刚问世之前一段不可思议,超出预期,可后期却有点后劲无力了,被测出各种badcase,今天一起吃瓜看看吧!喧嚣GPT-3 是著名人工智能科研公司 OpenAI 开发的文字生成 (text generation) 人工智能,相关论文今年5月份已经发表,当时就以天文数字级别的1,750亿参数量引发轰动。7月份时候GPT3提供了对商业公司、学校和个人可以使用的OpenAI api供研究者自行调用,自此研究者做了五花八门的应用,名噪一时。随便看一个GPT3常识推理的
2020-12-02 16:01:29
1431
原创 机器学习一线性模型——logistics回归
# -*- coding: utf-8 -*-"""Created on Mon Jul 9 13:36:25 2018@author: Wei_Zhan"""import matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasets, linear_model, discriminant_analy...
2018-07-10 10:25:39
378
原创 机器学习一 线性模型
此为python机器学习的系列作品的第一篇,对于线性模型的求解与讨论,理论部分可以参考《python大战机器学习》,此系列的主要代码来源也是这本书。对于线性回归模型的学习数据采用scikit-learn中的diabetes数据集。总共有10个属性,都是数字化的类型数据。def load_data(): diabetes = datasets.load_diabetes() ...
2018-07-10 10:13:40
493
原创 python单链表实现
# -*- coding: utf-8 -*-"""Created on Tue Jun 12 18:06:24 2018@author: Administrator"""class LNode: def __init__ (self, elem, next_ = None): self.elem = elem self.next = next...
2018-06-12 11:39:09
147
原创 python中函数、修饰符、和文件操作
1、函数在 Python 中,函数是一种基本类型的对象,这意味着· 可以将函数作为参数传给另一个函数· 将函数作为字典的值储存· 将函数作为另一个函数的返回值 · Python 中的函数传递方式是 call by reference 即引用传递,例如,对于这样的用法:· x = [10, 11, 12]· f(x)· 传递给函数 f 的是一个指向 x 所包含内容的引用,如果我们修改了这个引用所指向...
2018-04-28 11:12:16
324
原创 Python中常见模块的使用(OS、Re、DateTime的使用)
1、OS· os.remove(path) 或 os.unlink(path) :删除指定路径的文件。路径可以是全名,也可以是当前工作目录下的路径。· os.removedirs:删除文件,并删除中间路径中的空文件夹· os.chdir(path):将当前工作目录改变为指定的路径· os.getcwd():返回当前的工作目录· os.curdir:表示当前目录的符号· os.rename(old,...
2018-04-28 10:17:59
2263
原创 双向链表实现——Java语言版
对于双链表,每个节点既有前驱节点又有后继节点,在某些应用方面更加方便,对于其插入和删除需要修改两个指针,其实现的Java代码如下:package datastructure;public class DLLNode { private int data; private DLLNode next; private DLLNode previous; public int getData...
2018-04-23 10:39:52
193
原创 单链表的实现——Java版本
对于数据结构中最基础的单链表的实现,因为链表不需要连续的内存存储空间,不需要在创建时指定大小,因此比线性表更有优势,对其的插入,删除操作也就更复杂,以下是对链表的实现代码:package datastructure;public class Listnode { private int data; private Listnode next; public int getData() {...
2018-04-23 10:28:23
195
原创 栈的三种实现——Java语言描述
对于数据结构中常用的栈结构,其实现方式通常分为三种:一、基于简单数组的实现方式二、基于动态数组的实现三、基于链表的实现方式1、简单数组实现方式//最大空间必须事先声明public class ArrayStack { private int top; private int capacity; private int[] array; public ArrayStack() { ca...
2018-04-22 16:43:51
423
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人