- 博客(37)
- 收藏
- 关注
原创 阅读笔记——A Frustratingly Easy Approach for Entity and Relation Extraction
然而,大多数关系分类任务(如TACRED (Zhang et al.,2017b))只关注输入句子中给定的一对主语和宾语,在需要对多个实体提及之间的关系进行分类的端到端设置中,其有效性尚未得到评估。尽管它很简单,但我们发现这种流水线方法非常有效:使用相同的预训练编码器,我们的模型在三个标准基准上优于所有以前的联合模型:ACE04、ACE05和SciERC,相对于F1绝对提高了1.7%-2.8%。因此,我们期望这个简单的模型将作为端到端关系提取的一个非常强的基线,并使我们重新思考实体和关系联合建模的价值。
2023-09-23 08:30:00
198
原创 Request failed with status code 422
【代码】Request failed with status code 422。
2023-09-22 14:30:30
855
原创 PapeDeading:Deep into Regularity: A Simple but Effective Method for Chinese Named Entity Recognition
在本文中,提出了一种简单而有效的方法,用于调查中文NER中实体跨度的规律性,被称为规律性启发的重构网络(RICON)。具体来说,该模型由两个分支组成:规则性感知模块和规则性诊断模块。规则性感知模块捕捉每个跨度的内部规则性,以便更好地预测实体类型,而规则性诊断模块则被用来确定实体的边界,缓解对跨度规则性的过度关注。进一步构建了一个正交空间,鼓励两个模块提取不同方面的规则性特征。
2022-10-01 15:04:43
1137
2
原创 FLAT:Chinese NER Using Flat-Lattice Transformer
摘要近年来,汉字lattice结构被证明是一种有效的中文命名实体识别方法。然而,由于网格结构的复杂性和动态性,现有的基于网格的模型难以充分利用gpu的并行计算能力,推理速度通常较低。在本文中,我们提出了FLAT: FLAT - lattice-Transformer将lattice结构转化为由跨度组成的平面结构。每个跨度对应一个字符或潜在单词及其在原始格中的位置。借助Transformer的强大功能和精心设计的位置编码,FLAT可以充分利用lattice信息,具有良好的并行化能力。在四个数据集上的实验表明
2022-03-18 15:16:41
2379
3
原创 ncrf++:一个开源的神经序列标记工具包
1.介绍序列标记模型在许多NLP任务中非常流行,如命名实体识别(Named Entity Recognition, NER)、词性标记(part-of-speech, POS)和分词。目前最先进的序列标记模型大多采用具有输入字特征的CRF结构。LSTM(或双向LSTM)是一种常用的基于深度学习的序列标记特征提取方法。CNN也可以使用,因为它的计算速度更快。此外,词内的特征也可以用来表示词,这些特征可以通过字符LSTM或字符CNN结构或人定义的神经特征来捕获。ncrf++ 是一个基于PyTorch的框架,
2021-12-02 17:13:12
599
原创 Python案例——学生信息管理系统
Python案例——学生信息管理系统文章目录Python案例——学生信息管理系统1. 需求分析学生管理系统应具备的功能2. 系统设计系统功能结构3. 系统开发必备系统开发环境:4. 主函数设计5. 学生信息维护模块设计5.1 录入学生信息功能5.2 删除学生信息功能5.3 修改学生信息功能6. 查询/统计模块设计6.1 实现查询学生信息功能:6.2 实现统计学生总人数功能6.3 显示所有信息功能7. 排序模块设计8. 项目打包8.1 安装第三方模块1. 需求分析学生管理系统应具备的功能添加学生及.
2021-10-13 19:58:54
5285
原创 数学建模竞赛常考三大模型及十大算法
文章目录三大模型1 预测模型应用领域2 优化模型应用领域3 评价模型应用领域十大常用算法1 蒙特卡罗算法2 数据处理算法3 规划类问题4 图论算法5 计算机算法6 最优化理论的三大非经典算法7 网络算法和穷举法8 连续离散化方法9 数值分析算法10 图形处理算法三大模型1 预测模型神经网络预测、灰色预测、拟合插值预测(线性回归)、时间序列预测、马尔科夫链预测、微分方程预测、logistic模型等等。应用领域人口预测、水资源污染增长预测、病毒蔓延预测、竞赛获胜概率预测、月收入预测、销量预测、经济发展
2021-10-13 19:57:00
1385
原创 【总结】研究生数学建模优秀论文——面向康复工程的脑电信号分析和判别模型
面向康复工程的脑电信号分析和判别模型文章目录面向康复工程的脑电信号分析和判别模型摘要一、问题重述1.1 问题背景1.2 问题分析二、模型假设与符号说明2.1 模型基本假设2.2 模型符号说明三、数据预处理3.1 去趋势3.2 滤波3.3 不平衡样本的重采样四、问题一:模型建立与求解4.1 L2正则化4.2 卷积神经网路方法4.3 随机森林方法4.4 目标的分类识别方法设计本题中我们分别4.5 不同方法的合理性分析五、问题二:模型建立与求解5.1 L1正则化5.2 单个被试者通道选择算法设计5.3 所有被试
2021-10-13 09:38:12
2088
原创 数学建模准备工作
前期一周做一个真题,然后花一周时间复盘来学习。为什么跟大家说说,你一周时间来做题,然后还要花同样的时间一周来复盘的,就是说你可能会在这一周里面做完了之后,时间一定要固定好,就是和你真实的时间保持一致。然后这样的话,和你真正去比赛的时候时间一致,你可以按照预估的一个进度来进行。分工三个人:一个人主要负责代码,一个人主要负责写论文,剩下一个人辅佐写代码和论文。当看一篇论文的代码实现的时候应该有百分之八十就是虚数,有一大半的部分是由那个主要写代码同学来做的那里,但是那里面可能会遇到一些你们之前没有准备到的
2021-10-11 21:56:42
1200
转载 机器学习中的特征工程
1 特征工程是什么Feature engineering is the process of using domain knowledge of the data to create features that make machine learning algorithms work.特征工程是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优(或
2021-10-11 11:09:27
1074
原创 Python——文件
Python——文件文章目录Python——文件1. 编码格式介绍2. 文件读写操作2.1 内置函数open()创建文件对象2.2 语法规则:file=open(filename [,mode,encoding])2.3 常用的文件打开模式:3. 文件对象的常用方法4. with语句(上下文管理器)5. 目录操作1. 编码格式介绍常见的字符编码格式:(1)Python的解释器使用的是Unicoude(内存)(2).py文件在磁盘上使用UTF-8存储(外存)2. 文件读写操作2.1 内置函数o.
2021-05-10 15:36:59
358
原创 Python——模块与包
Python——模块与包文章目录Python——模块与包1. 什么叫模块2. 自定义模块2.1 创建模块2.2 导入模块3. 以主程序的形式执行4. python中的包5. Python中常用的内置模块6. 第三方模块的安装及使用6.1 第三方模块的安装6.2 第三方模块的使用1. 什么叫模块(1)模块英文为Modules(2)函数与模块的关系:一个模块中可以包含N多个函数(3)在Python中一个扩展名为.py的文件就是一个模块(4)使用模块的好处:①方便其他程序和脚本的导入并使用②避免.
2021-05-10 15:36:26
331
翻译 python——面向对象特征
python——面向对象特征文章目录python——面向对象特征0. 面向对象的三大特征1. 封装2. 继承3. 方法重写4. objeck类5. 多态5.1 静态语言与动态语言6. 特殊方法和特殊属性7. 类的浅拷贝与深拷贝0. 面向对象的三大特征封装:提高程序的安全性(1)将数据(属性)和行为(方法)包装到类对象中。在方法内部对属性进行操作,在类对象的外部调用方法。这样,无需关心方法内部的具体实现细节,从而隔离了复杂度。(2)在Python中没有专门的修饰符用于属性的私有,如果该属性不希.
2021-05-10 15:35:53
125
原创 python——面向对象特征
python——面向对象特征文章目录python——面向对象特征0. 面向对象的三大特征1. 封装2. 继承3. 方法重写4. objeck类5. 多态5.1 静态语言与动态语言6. 特殊方法和特殊属性7. 类的浅拷贝与深拷贝0. 面向对象的三大特征封装:提高程序的安全性(1)将数据(属性)和行为(方法)包装到类对象中。在方法内部对属性进行操作,在类对象的外部调用方法。这样,无需关心方法内部的具体实现细节,从而隔离了复杂度。(2)在Python中没有专门的修饰符用于属性的私有,如果该属性不希.
2021-05-10 15:35:21
219
原创 Python——类与对象
Python——类与对象文章目录Python——类与对象1. 两大编程思想1.1 编程界的两大阵营2. 类和对象的创建2.1 定义2.1.1 类2.1.2 数据类型2.1.3 对象2.2 类的创建2.2.1 创建类的语法2.2.2 类的组成2.2.3 对象的创建3. 类属性、类方法、静态方法4. 动态绑定属性和方法1. 两大编程思想1.1 编程界的两大阵营面向过程面向对象区别事物比较简单,可以用线性的思维去解决事物比较复杂,使用简单的线性思维无法解决面向.
2021-05-10 15:34:52
199
原创 Python——bug
Python——Bug文章目录Python——Bug1. Bug的由来及分类1.1 Bug的常见类型1.1.1 粗心导致的语法错误SyntaxError1.1.2 知识不熟练导致的错误1.1.3 思路不清导致的问题2. 不同异常类型的处理方式2.1 try...except...except结构2.2 try...except...else结构2.3 try...except...else...finally结构2.4 Python中常见的异常类型总结3. Python的异常处理机制4. PyCharm.
2021-05-10 15:33:35
249
原创 Python-函数
Python——函数文章目录Python——函数1. 函数的创建和调用1.1 函数的定义1.2 函数的创建2. 函数的参数传递2.1 位置实参2.2 关键字实参3. 函数的返回值4. 函数的参数定义4.1 函数定义默认值参数4.2 个数可变的位置参数4.3 个数可变的关键字形参4.4 函数的参数总结5. 变量的定义域6.递归参数6.1 什么是递归函数6.2 递归函数的组成部分6.3 递归的调用过程6.4 递归的优缺点1. 函数的创建和调用1.1 函数的定义函数就是执行特定任何以完成特定功能的一段代.
2021-05-10 15:30:21
408
原创 Python-字符串
Python——字符串文章目录Python——字符串1. 字符串的驻留机制1.1 驻留机制的几种情况(交互模式)1.2 sys中的intern方法强制2个字符串指向同一个对象1.3 Pycharm对字符串进项了优化处理1.4 字符串驻留机制的优缺点2. 字符串的常用操作2.1 字符串的查询操作的方法2.2 字符串的大小写转换操作的方法2.3 字符串内容对齐操作的方法2.4 字符串劈分操作的方法2.5 判断字符串操作的方法2.6 字符串操作的其他方法3. 字符串的比较4. 字符串的切片操作5. 格式化字符.
2021-05-10 15:29:41
440
原创 Python——列表、字典、元组、集合
Python——列表、字典、元组、集合文章目录Python——列表、字典、元组、集合1. 列表元素的增加操作2. 列表元素的删除操作3. 元组的创建方式1. 直接小括号2. 使用内置函数tuple3. 只包含一个元组的元素需要使用逗号和小括号4. 列表、字典、元组、集合总结1. 列表元素的增加操作方法/其他操作描述append()在列表的末尾添加一个元素extend()在列表的末尾至少添加一个元素insert()在列表的任意位置添加一个元素切片在列表的任.
2021-05-10 15:28:45
155
原创 Word2Vec
背景知识词的表示方法① One-hot Representation 独热表示优点:表示简单缺点:词越多,维数越高(词表示大小V)无法表示词与词之间的关系②SVD优点:可以一定程度上得到词与词之间的相似度。缺点:矩阵太大,SVD矩阵分解效率低,学习得到的词向量可解释性差。例如:I enjoy flyingI like NLPI like deep learning矩阵如下:统计出来每个词和其他词共现的次数③Distributed Representation分布式表示/稠密表示:
2021-05-10 15:24:02
82
原创 conda命令
conda list:显示base环境所有包conda env list:查看已安装的环境conda activate 《env name》:进入指定环境conda deactivate:退出当前环境pip install 《package name》:在当前环境安装包conda --version:查看指定版本conda upgrade conda:更新conda和其他所有包...
2021-05-08 11:11:47
150
原创 阅读笔记——GloVe
文章目录1. 来源2. 介绍3. 入门(代码下载)4. 下载预先训练好的词向量4.1 预先训练好的词向量4.2 用于预处理Twitter数据的Ruby[脚本](https://nlp.stanford.edu/projects/glove/preprocess-twitter.rb)5. Giting GloVe6. 强调6.1 Nearest neighbors6.2 线性子结构7. 训练8. 模型概述9. 形象化10. 发行史11. 探讨1. 来源GloVe来自斯坦福的一篇论文2. 介绍Glov
2021-04-13 19:54:28
498
原创 论文阅读笔记——基于神经网络语义匹配的自动问答系统研究与应用
写在前面这是南京邮电大学一名专硕硕士毕业论文,发表在2020年4月。论文关键词有四个:关键词提取,文本分类,语义匹配,自动问答。0. 摘要 目前常用的答案选择方法\color{red}{答案选择方法}答案选择方法中问答匹配结果的好坏取决于句子特征向量的构建,直接用于对句子建模容易缺失词汇之间的语义信息,对匹配度的计算影响较大。这篇论文针对当前主流答案选择方法中的缺陷提出基于改进的比较对齐语义信息的答案选择技术\color
2021-04-09 15:06:55
1050
5
原创 Python中%运算符
%运算符的作用%运算符就是用来格式化字符串的。在字符串内部,%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者值,顺序要对应好。如果只有一个%?,括号可以省略。eg1:输入:'Hello,%s'%'world'输出为:'Hello,world'eg2:输入:'Hi,%s,you have $%d.'%('Michael',1000000)输出为:'Hi,Michael.you have $1000000.'...
2020-09-29 14:41:06
2287
原创 阅读笔记——基于机器学习的文本情感多分类的学习与研究
文章目录1 文章简介2 文本情感分类概述1 文章简介文本分类与情感分类是自然语言处理中基础的领域,在机器学习的基础上,分析了线性逻辑回归算法、朴素贝叶斯模型在文本情感分类项目中的应用,并针对数据处理、模型构建、模型训练、模型测试过程中初学者难以解决和易出错的部分进行分析与实现。结合kaggle上的比赛数据实例,实现了完整的文本情感多分类项目并做出详细分析,项目评测结果较为可观,证实可以帮助初学者更易上手文本情感多分类和机器学习。同时提出了基于传统二分类问题的多分类问题解决方法。2 文本情感分类概述
2020-08-22 21:28:19
2657
原创 阅读笔记——基于CART决策树的计算机网络课程学生成绩分析
阅读文章——基于 CART 决策树的计算机网络课程学生成绩分析写在前面近几周学习了决策树的相关知识,想要阅读一些用到这个知识的文章,但是在知网上浏览了几篇硕博士论文的摘要之后,发现一篇成熟的论文中,决策树这个知识只是整个论文实现目的的一个理论基础,自己现有的知识储备不足以读懂整篇论文,偶然看到了2019.12发表在计算机教育上的一篇期刊文章,对决策树地应用进行了介绍,最后就在对这篇文章进行了详细地阅读。1 文章简介此文章利用 CART 决策树算法对学生的计算机网络相关课程成绩深入分析,找出影响学生.
2020-08-16 19:02:12
955
7
原创 钉钉视频会议中的屏幕共享
记载一下自己的小发现今天开了两个视频会议,下午的会议是每周的学习汇报,晚上的会议主要是听老师讲的课。在晚上听老师讲课的时候,老师换了一个窗口,和我们看到的窗口不一样,但是老师还是一直在讲,随后同学截屏了我们看到的窗口,老师看到后说她放的不是这个窗口,然后关闭共享再打开之后,才是我们看到的窗口,我在会议结束后,重点实践了一下这个钉钉屏幕共享功能。1 准备工作一部手机(或电脑)登录另一个钉钉号(以下称2号机)一台汇报工作的电脑(我的电脑),登录我的钉钉号(称1号机)2 第一个PPT汇报当我汇
2020-08-15 21:08:09
13118
原创 github改用户名username
github中的username怎么改第一次注册时的github时,用户名总是重复,当时随便起了一个,所以现在想要改一下,下面说一下改的过程第一步,打开settings第二步,account中找到change username下面点击确定最后,进入改username最后一步填入自己想要改的名字就可以了,但是要注意,有内容的仓库的名字也要改,不然仓库里的东西推到远端会出错。...
2020-08-10 18:19:34
3930
原创 传统的机器学习方法——决策树(下)
1 决策树的剪枝1.1 剪枝介绍在决策树学习中将已生成的树进行简化的过程称为剪枝。具体地,剪枝从已生成的树上裁掉一些子树或叶结点,并将其根结点或父结点作为新的叶结点,从而简化分类树模型,这就是决策树的剪枝。1.2 损失函数1.2.1 定义决策树的剪枝往往通过极小化决策树整体的损失函数或代价函数来实现。设树T的叶结点个数为 |T|,t 是树 T 的叶结点,该叶结点有 Nt 个样本点,其中 k 类的样本点有 Ntk 个,k=1,2,…,K, Ht(T) 为叶结点 t 上的经验熵,α>=0为参数,
2020-08-09 18:07:29
930
原创 python中的bug
python中解决SyntaxError: Non-UTF-8 code starting with ‘\xc7’ in file 的问题在pycharm中运行.py程序,出现如下问题:只需要一步就可以解决:在程序的第一行前面加上:# coding=gbk注意:coding与=,=与gbk之间没有空格程序运行结果就可以出来(如下):...
2020-08-08 11:13:12
335
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人