
机器学习
文章平均质量分 81
华师数据学院·王嘉宁
研究方向:深度学习、自然语言处理、知识图谱。
研究兴趣:大语言模型训练与推理、知识增强预训练、Prompt-tuning、小样本学习、问答系统、信息抽取。
展开
-
NLP简单的数据增强方法
NLP简单的数据增强方法 当训练数据量不充分,或者分布单一的情况下,数据增强可以快速扩充语料以避免过拟合的问题,同时,数据增强也可以提升模型的鲁棒性,避免微弱的变化使得模型无法泛化到相似的语境中。 本文介绍几种比较简单但常用的NLP数据增强方法,包括显式和隐式两个方面,在实验或比赛中可以提升效果。可使用nlpaug工具快速实现这些技术。一、动机机器学习和深度学习在包括文本分类等自然语言任务达到不错的效果,但他们需要依赖于大规模的标注数据,除了直接使用小样本学习外,显式数据增强格外有效;数据原创 2021-11-30 11:11:37 · 2013 阅读 · 0 评论 -
A survey on Few-shot Learning (小样本学习)
A survey on Few-shot Learning (小样本学习) 机器学习已经成功地在数据密集型任务上得以应用,但通常却不能够处理数据很少的情况。最近,小样本学习(Few-shot Learning,FSL)被提出用于解决这个问题。在先验知识的基础上,FSL可以有效的涵盖一个只有极少监督信息数量样本的新任务。本文,我们将对小样本学习FSL进行一个系统的梳理。首先给出FSL一个形式化的定义,其次根据相关机器学习的问题进行分类,同时指出一个核心的关键问题即小样本学习不能依赖于传统的经验风险最小化的原创 2020-09-25 17:39:11 · 5019 阅读 · 2 评论 -
k近邻算法
k近邻算法 k近邻算法是一个基本的分类回归方法,其没有显式的学习过程,而是完全取决于数据,因此k近邻是基于数据的学习算法,其只有唯一的一个参数 k(k>0,k∈N+)k(k>0,k\in\mathbb{N}_+)k(k>0,k∈N+) 。1、k近邻算法 给定一组已知数据 T={(xi,yi)}i=1i=NT=\{(x_i,y_i)\}_{i=1}^{i=N}T={(xi,yi)}i=1i=N,其中 xix_ixi 表示样本的特征向量,yiy_iyi 是对应的标签。通原创 2020-08-15 15:40:58 · 422 阅读 · 0 评论 -
基于PCA的图像压缩实现
基于PCA的图像压缩实现注:该内容为校内课程实验,仅供参考,请勿抄袭!源码:PPCA-for-Image-Compession摘要 随着计算机互联网的发展和数据的日益增长,如何高效的处理和传输海量数据成为大数据处理的瓶颈问题,尤其对于图像类数据,通常其占有空间大,包含信息量丰富,如何对图像数据进行压缩吸引广大研究者们的注意。本文通过调研PCA图像压缩的相关工作,认为当前方法依赖于整个数据集,压缩效率低、占据内存量大的问题,本文提出一种分片PCA(P-PCA)图像压缩算法,旨在通过对图像进行分片,并原创 2020-08-02 17:50:10 · 4905 阅读 · 2 评论 -
生成对抗网络(GAN)之 Basic Theory 学习笔记
生成对抗网络(GAN)之 Basic Theory 学习笔记 前言:最近学习了李宏毅生成对抗网络篇(2018年)的视频(视频地址:李宏毅对抗生成网络(GAN)国语教程(2018)),因为截止今天(3.23),2020版还未讲到生成对抗网络,因此选择18年。本次学习笔记主要为Basic Theory部分,主要讲解GAN的数学原理。 GAN又称生成对抗网络,是由Ian Goodfellow等人...原创 2020-03-23 16:55:00 · 1117 阅读 · 1 评论 -
感知机模型
感知机模型本内容为《统计学习方法》学习笔记,会不定时更新 感知机模型是一个非常简单的线性机器学习分类器,其定义为:不过其有一个非常苛刻的前提——输入样本需要满足线性可分,亦即非线性可分的样本无法实现感知机分类任务。 给定一组样本 T={(x1,y1),...,(xN,yN)}T=\{(x_1,y_1),...,(x_N,y_N)\}T={(x1,y1),...,(xN,yN...原创 2020-03-18 18:59:41 · 1224 阅读 · 0 评论 -
python实现计算精度、召回率和F1值
python实现计算精度、召回率和F1值 摘要:在深度学习的分类任务中,对模型的评估或测试时需要计算其在验证集或测试集上的预测精度(prediction/accuracy)、召回率(recall)和F1值。本文首先简要介绍如何计算精度、召回率和F1值,其次给出python编写的模块,可直接将该模块导入在自己的项目中,最后给出这个模块的实际使用效果。一、混淆矩阵及P、R、F1计算原理1、混淆...原创 2019-03-02 11:09:47 · 45296 阅读 · 13 评论 -
论文解读:Attention Is All You Need
论文解读:Attention Is All You Need论文解读:Attention Is All You Need全文摘要译文二、简要信息三、算法模型详解3.1 注意力机制3.2 Position-wise Feed-Forward Networks3.3 位置表征3.4 Transformer论文解读:Attention Is All You Need 在深度学习领域,绝大多数是以神...原创 2019-07-18 21:45:26 · 2045 阅读 · 0 评论