
NLP
文章平均质量分 51
嫩芽新枝
希望各位大神多多指教
展开
-
基于pytorch+transformers的NER实体识别
命名实体识别作为一项基础的NLP任务,其用在信息抽取、关系抽取、图谱构建等任务中都作为基础存在原创 2022-07-06 10:36:14 · 2173 阅读 · 0 评论 -
基于pytorch+transformers的文本分类
文本分类作为NLP基础任务,是最常用的服务了,本文提供一个开箱即用的文本分类器。原创 2022-07-05 13:42:25 · 2691 阅读 · 1 评论 -
NLP实用工具
在做NER实体识别时,经常会遇到将BIO等格式的标注或者预测数据转成brat等json格式,反之将brat等json格式(各类比赛中采用格式)转成BIO格式进行模型训练也是常常遇到的,下面给出开箱即用的函数工具。...原创 2022-07-04 16:04:40 · 360 阅读 · 0 评论 -
From TextCNN to Sentence Similarity(句子分类到表征)
TextCNN basic基础知识自动提取文本的特征,将sentence进行分词,组成每个句子的词,每个词对应一个id,(也可以不分词,以字为粒度)并将词转化为id,每个句子都是id组成的数据,将所有的句子都padding到最长的句子max_len_stence,也可以设置一个值为句子长度值。然后进行embedding,每个id对应一个size的词向量,这样每个句子的presentation即为[max_len_stence,size],到此也就完成了embedding,后面类似图像的卷积和池化提取句子原创 2022-05-17 15:01:52 · 271 阅读 · 0 评论 -
深度学习(二、全连接网络FNN)
在前馈神经网络中,各神经元分别属于不同的层。整个网络中无反馈,信号从输入层向输出层单向传播,可用一个有向无环图表示。为了引入非线性变换(因为如果没有非线性变换,即使层数再多也只是做了一些仿射函数而已),在各个层中可能会引入一些激活函数(如sigmonid激活函数将值域映射到0~1,tanh激活函数将值域映射到-1~1。)这个设计初衷最开始是模仿人脑神经元的想法(其实关联并不是特别大),细胞体中的神经细胞膜上有各种受体和离子通道,胞膜的受体可与相应的...原创 2022-05-15 17:38:58 · 1768 阅读 · 0 评论 -
强人工智能:GPT3?
GPT3问世已经半年之久了,GPT3模型在刚刚问世之前一段不可思议,超出预期,可后期却有点后劲无力了,被测出各种badcase,今天一起吃瓜看看吧!喧嚣GPT-3 是著名人工智能科研公司 OpenAI 开发的文字生成 (text generation) 人工智能,相关论文今年5月份已经发表,当时就以天文数字级别的1,750亿参数量引发轰动。7月份时候GPT3提供了对商业公司、学校和个人可以使用的OpenAI api供研究者自行调用,自此研究者做了五花八门的应用,名噪一时。随便看一个GPT3常识推理的原创 2020-12-02 16:01:29 · 1451 阅读 · 0 评论