
深度学习
文章平均质量分 64
Better Bench
CS博士;研究领域:类脑计算、增量学习、量化投资、AI、数据挖掘、自然语言处理、数学建模,特长网球4.0
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
通过torch.utils.data.DataLoader可提高深度学习的10倍运行的速度?
在深度学习的训练过程中,数据加载是一个关键步骤,它直接影响到模型训练的效率。为了提高运行速度,我们通常会采用多种方法,比如数据预处理、多线程加载、缓存策略等。然而,有一个经常被忽视的优化点——调整torch.utils.data.DataLoader中的参数,这可以在某些情况下带来高达10倍的速度提升。原创 2024-11-29 09:57:06 · 624 阅读 · 0 评论 -
2024机器遗忘(Machine Unlearning)技术分类-思维导图
本文介绍了机器遗忘技术的分类、优缺点、威胁、攻击、防御机制以及评估方法。首先将机器遗忘技术分为精确遗忘和近似遗忘两大类,并对每类中的不同方法进行了详细讨论。精确遗忘技术涉及SISA结构、图模型、k-Means和联邦学习等,而近似遗忘技术则基于影响函数、重新优化、梯度更新和特定于图数据的方法。此外指出这些技术在存储、假设、模型效用、计算成本和处理动态数据方面的局限性。原创 2024-07-05 10:32:46 · 2321 阅读 · 0 评论 -
Windows11+CUDA12.0+RTX4090如何配置安装Tensorflow2-GPU环境?
电脑配置Windows 11cuda 12.0RTX4090。由于tensorflow2官网已经不支持cuda11以上的版本了,配置cuda和tensorflow可以通过以下步骤配置实现。原创 2024-06-20 16:18:10 · 1084 阅读 · 0 评论 -
如何下载DVS Gesture数据集?解决tonic.datasets.DVSGesture错误HTTP Error 403: Forbidden
DVSGesture数据集是一个专注于动态视觉传感(Dynamic Vision Sensor, DVS)技术的数据集,它包含了基于事件的图像记录,用于手势识别任务。DVSGesture数据集由一系列动态图像组成,这些图像是通过动态视觉传感器捕获的,与传统的基于帧的图像不同,DVS技术对场景中的变化(如运动)非常敏感。据集主要用于手势识别研究,它包含了多种不同的手势类别,这些类别可以用于训练和测试机器学习模型,以识别和分类不同的手势动作。原创 2024-06-20 15:30:27 · 1304 阅读 · 0 评论 -
【博士每天一篇文献-综述】基于脑启发的连续学习算法有哪些?附思维导图
脑启发的连续学习方法主要分为四类:突触启发方法、双系统启发方法、睡眠启发方法和模块化启发方法。经典连续学习方法主要分为三类:重放方法、正则化方法和稀疏化方法。原创 2024-05-16 18:29:29 · 1292 阅读 · 0 评论 -
【NLP】如何实现快速加载gensim word2vec的预训练的词向量模型
加载word2vec词向量,每次加载都是几分钟,效率特别低。如何提高加载的速度,有三种解决方法。原创 2024-03-12 17:39:50 · 1503 阅读 · 0 评论 -
【人工智能课程】计算机科学博士作业三
来源:李宏毅2022课程第10课的作业。图片攻击是指故意对数字图像进行修改,以使机器学习模型产生错误的输出或者产生预期之外的结果。这种攻击是通过将微小的、通常对人类难以察觉的扰动应用于输入图像来实现的。图片攻击是对深度学习系统中的鲁棒性和安全性的一种测试,也可以用于欺骗、隐私侵犯、对抗性水印等。原创 2024-03-06 11:24:16 · 1578 阅读 · 1 评论 -
【人工智能课程】计算机科学博士作业二
使用TensorFlow1.x版本来实现手势识别任务中,并用图像增强的方式改进,基准训练准确率0.92,测试准确率0.77,改进后,训练准确率0.97,测试准确率0.88。2 读取数据集3 创建占位符① TensorFlow要求您为运行会话时将输入到模型中的输入数据创建占位符。② 现在要实现创建占位符的函数,因为使用的是小批量数据块,输入的样本数量可能不固定,所以在数量那里要使用None作为可变数量。原创 2024-01-30 14:03:49 · 1353 阅读 · 0 评论 -
【人工智能课程】计算机科学博士作业一
这是一个非时间序列的回归任务,预测公共场所获取的人群数据,预测会发生COVID-19阳性的人数。改进角度,参考博客**:http://t.csdnimg.cn/fUAzT。我将老师给的代码重构了结构,便于组员之间协作编程,无需修改的代码都放到了utils.py中。只需要修改特征选择、神经网络、模型训练部分的代码就可以。原创 2024-01-19 00:15:07 · 961 阅读 · 2 评论 -
深度学习和机器学习中针对非时间序列的回归任务,有哪些改进角度?
在非时间序列的回归任务中,深度学习和机器学习都是常用的方法。为了进一步提升模型的性能,可以通过改进数据处理、数据增强、特征选择、模型选择、模型正则化与泛化、优化器、学习率、超参数调优等方面,来提升模型的性能和可解释性。原创 2024-01-18 19:42:48 · 1981 阅读 · 1 评论 -
【2023最新】Matlab 保存JSON数据集文件,并用Python读取
我想用json格式保存MATLAB生成是数据集,包括数据data,数据Label。然后用python读取JSON文件作为训练集。原创 2023-02-16 22:06:42 · 1695 阅读 · 0 评论 -
【深度学习】Pytorch面试题:什么是 PyTorch?PyTorch 的基本要素是什么?Conv1d、Conv2d 和 Conv3d 有什么区别?
PyTorch 是基于 Torch 库的计算机软件的一部分,它是 Python 的开源机器学习库。它是由 Facebook 人工智能研究小组开发的深度学习框架。它用于。原创 2022-09-25 20:54:32 · 4947 阅读 · 0 评论 -
【深度学习】TensorFlow面试题:什么是TensorFlow?你对张量了解多少?TensorFlow有什么优势?TensorFlow比PyTorch有什么不同?该如何选择?
TensorFlow是一个基于Python的库, 用于创建机器学习应用程序。它是执行复杂数学的低级工具包。它为用户提供了可定制性选项, 以构建实验性学习体系结构。它还可以帮助用户与他们合作, 并将他们转变为正在运行的软件。它最初由Google Brain团队的研究人员和工程师创建, 并于2015年成为开源。TensorFlow由两个词Tensor和Flow组成;张量被称为多维数组的数据表示, 流意味着对张量执行的一系列操作。原创 2022-09-25 20:52:54 · 3340 阅读 · 0 评论 -
【深度学习】猫狗识别TensorFlow2实验报告
实验二:猫狗识别一、实验目的利用深度学习实现猫狗动物识别,采用Kaggle提供的公开数据集,训练深度学习模型,对测试集猫狗中的图片准确分类。通过该实验掌握深度学习中基本的CV处理过程。二、实验原理(1)采用用卷积神经网络训练卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网络在图像和语音识别方面能够给出更好的结果。这一模型也可以使用原创 2021-07-03 15:47:44 · 23555 阅读 · 13 评论 -
【深度学习】手写数字识别Tensorflow2实验报告
实验一:手写数字识别一、实验目的利用深度学习实现手写数字识别,当输入一张手写图片后,能够准确的识别出该图片中数字是几。输出内容是0、1、2、3、4、5、6、7、8、9的其中一个。二、实验原理(1)采用用全连接神经网络训练全连接神经网络模型是一种多层感知机(MLP),感知机的原理是寻找类别间最合理、最具有鲁棒性的超平面,感知机最具代表的是SVM支持向量机算法。神经网络同时借鉴了感知机和仿生学,通常来说,动物神经接受一个信号后会发送各个神经元,各个神经元接受输入后根据自身判断,激活产生输出信号后汇总从原创 2021-07-03 15:42:27 · 26784 阅读 · 1 评论 -
【深度学习】Attention的原理、分类及实现
目录1 原理1.1 简介1.2 原理2 分类2.1 计算区域2.2 所用信息2.3 结构层次2.4 模型方面2.5 相似度计算方式3 Keras实现1 原理1.1 简介Attention是注意力机制,本质上对关注的多个对象有个不同的权重,从而关注重点不同。Attention是Transformer、Bert、GPT的基础。引入Attention机制的原因参数少:相对于RNN、CNN复杂度小,参数小速度快:解决了RNN不能并行计算的问题效果好:解决了长距离的信息会被弱化问题,Attentio原创 2021-06-11 20:03:36 · 5989 阅读 · 4 评论 -
【深度学习+面经】Transformer 网络学习笔记
目录1 引言2 详解3 优缺点3.1 优点3.2 缺点4 应用领域5 面经5.1 第一部分5.2 第二部分1 引言Transformer中抛弃了传统的CNN和RNN,整个网络结构完全是由Attention机制组成。更准确地讲,Transformer主要由多头self-Attenion和Feed Forward Neural Network组成。一个基于Transformer的可训练的神经网络可以通过堆叠Transformer的形式进行搭建,作者的实验是通过搭建编码器和解码器各6层,总共12层的Enco原创 2021-06-07 17:26:20 · 5024 阅读 · 5 评论 -
【深度学习】Generative Adversarial Networks ,GAN生成对抗网络分类
目录1 思维导图2 大纲3 经典GAN简介3.1 SGAN3.2 Conditional GAN3.3 Bidirectional GAN (BiGAN)3.4 InfoGAN3.5 Auxiliary Classifier GAN (AC-GAN)3.6 Boundary Equilibrium GAN (BEGAN)3.7 Self-attention GAN (SAGAN)3.8 Deep Convolutional GAN (DCGAN)3.9 MSG-GAN1 思维导图2 大纲序号对应论原创 2021-06-05 20:57:28 · 1422 阅读 · 2 评论 -
【元学习meta-learning】通俗易懂讲解元学习以及与监督学习的区别
目录1 引言2 提出问题3 Few-shot learning小样本学习4 Meta-learning元学习5 如果通过机器学习学习出区分不同事物的能力?6 传统监督学习与小样本学习的区别7 Meta-learning中相关概念1 引言人工智能技术有机器学习、深度学习、强化学习、元学习。元学习是其实是深度学习上的一个发展,为了解决小样本问题的,注意这是有区别机器学习和深度学习中的有监督学习的。接下来举例来讲解Meta-learning是什么?怎么做?以及和机器学习或深度学习中的监督学习的区别2 提出原创 2021-04-04 14:08:42 · 2295 阅读 · 1 评论 -
DL+ML集成学习--附思维导图
1 模型融合把强分类器进行强强联合,使得模型融合后的模型效果更强投票法线性融合Stacking机器学习元算法将弱分类器通过学习算法集成起来,变成很强的分类器Bagging个体学习器不存在依赖关系,可同时对样本随机采样并行化生成个体学习器。代表作为随机森林(Random Forest)Boosting个体学习器存在依赖关系,基于前面模型的训练结果误差生成新的模型,必须串行化生成。代表的算法有:Adaboost、GBDT、XGBoost...原创 2021-03-15 17:05:32 · 316 阅读 · 0 评论 -
【Deepin 20系统】解决Check failed: err == cudaSuccess || err == cudaErrorInvalidValue Unexpected CUDA erro
问题环境Nvidia RTX 2070Tensorflow 2在利用GPU运行了程序。中断重新运行程序,就会报错,GPU内存不够,显然是被占用了F tensorflow/stream_executor/cuda/cuda_driver.cc:175] Check failed: err == cudaSuccess || err == cudaErrorInvalidValue Unexpected CUDA error: out of memory解决办法因为程序虽然没有运行了,但进程还原创 2021-03-09 20:33:40 · 3543 阅读 · 0 评论 -
【Tensorflow 2】解决tensorflow.python.framework.errors_impl.UnknownError: [_Derived_] Fail to find the
1 问题环境Deepin 20 OS linux系统Tensorflow2.0Python3.6GPU Rtx 2070cuda 10.0cudnn 10.0在使用双向LSTM时tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(64)),报以下错误信息tensorflow.python.framework.errors_impl.UnknownError: [Derived] Fail to find the dnn im原创 2021-03-08 22:57:58 · 2268 阅读 · 1 评论 -
【Pytorch】查看GPU是否可用
使用pytorch,可以使用如下语句查询GPU是否可用:import torchprint(torch.__version__) # 查看torch当前版本号print(torch.version.cuda) # 编译当前版本的torch使用的cuda版本号print(torch.cuda.is_available()) # 查看当前cuda是否可用于当前版本的Torch,如果输出True,则表示可用...原创 2021-03-08 22:18:37 · 25921 阅读 · 0 评论 -
【Tensorflow 2】解决‘Tensor‘ object has no attribute ‘numpy‘
在文件中加入一行代码tf.compat.v1.enable_eager_execution()原创 2021-03-06 13:33:37 · 5249 阅读 · 3 评论 -
pip安装iterstrat.ml_stratifiers import MultilabelStratifiedKFold, MultilabelStratifiedShuffleSplit
安装方法pip install iterative-stratification开源源码介绍MultilabelStratifiedKFold是用于多标签多分类的K折交叉验证from iterstrat.ml_stratifiers import MultilabelStratifiedKFold, MultilabelStratifiedShuffleSplit# 5折nfold = 5kf = MultilabelStratifiedKFold(n_splits=nfold, shuf原创 2021-03-05 21:57:38 · 3824 阅读 · 1 评论 -
多标签多分类Muticlass Mutioutput的Mutilogloss(mlogloss)实现
原理实现logloss的实现def logloss(y_true, y_pred, eps=1e-15): import numpy as np # Prepare numpy array data y_true = np.array(y_true) y_pred = np.array(y_pred) assert (len(y_true) and len(y_true) == len(y_pred)) # Clip y_pred between e原创 2021-03-05 16:23:33 · 1565 阅读 · 0 评论 -
深度复数技术开源代码汇总
目录1 引言2 开源源码2.1 使用DeepComplex的所有源码汇总2.2 实现复数技术扩展的工具箱2.3 实现复数CNN的源码2.4 实现复数LSTM的源码1 引言复数的深度学习首次在2018年提出Deep Complex Networks (ICLR 2018)复数的应用非常广泛,比如在音频处理、信号处理、核磁共振信息处理都涉及到复数技术作者首次开源了复数处理技术的代码,并提出了卷积神经网络的复数处理技术,后者也有人陆续提出LSTM 的复数处理。接下来估计还会在提出以下方面的复数技术cl原创 2021-02-26 17:11:20 · 1163 阅读 · 0 评论 -
机器学习中label如何实现多标签编码?
实现如果总共有5类,并标记为0-4当一个label有1,2两个标签时,执行如下array([[0, 0, 1, 1, 0]])当一个label有0 2 3 4标签时,执行如下原创 2021-02-24 14:32:13 · 2463 阅读 · 0 评论