
深度学习
文章平均质量分 55
许野平
非常喜欢软件设计这份工作,有不错的数学基础,喜欢读书、摄影与音乐。
展开
-
12G的RTX 3060显卡在深度学习训练中的应用能力
12G的RTX 3060显卡在深度学习训练中有一定的应用能力,具体能做哪些训练任务,需要考虑模型的复杂度、数据集的大小、训练框架的兼容性等多个因素。原创 2024-10-13 00:09:51 · 3218 阅读 · 0 评论 -
12G显存的显卡能做那些深度学习训练?
12G显存的显卡在深度学习模型训练中具有一定的能力,但具体能够训练的模型类型和规模会受到多种因素的影响,如模型的复杂度、数据集的大小、使用的深度学习框架以及显卡的其他性能参数等。原创 2024-10-13 00:07:11 · 1378 阅读 · 0 评论 -
Stable Diffusion 蒙版:填充、原图、潜空间噪声(潜变量噪声)、潜空间数值零(潜变量数值零)
这些模式为Stable Diffusion的用户提供了丰富的图像编辑和重绘选项。用户可以根据实际需求选择合适的模式,以实现所需的图像效果。需要注意的是,不同模式的选择可能会对最终生成的图像产生显著影响,因此建议用户在实际操作前进行充分的试验和比较。原创 2024-09-26 12:10:48 · 1211 阅读 · 0 评论 -
Stable Diffusion ControlNet 的 control model(控制模型)
在Stable Diffusion(SD)中,ControlNet的control model(控制模型)扮演着至关重要的角色,它们是实现精细图像控制的关键组件。原创 2024-09-25 13:47:08 · 616 阅读 · 0 评论 -
Stable Diffusion 的 ControlNet 主要用途
SD(Stable Diffusion)中的ControlNet是一种条件生成对抗神经网络(Conditional Generative Adversarial Network, CGAN)的扩展技术,它允许用户通过额外的输入条件来控制预训练的大模型(如Stable Diffusion)的生成过程。ControlNet在SD的数据流中扮演着关键角色,它位于模型生成过程的输入端,通过引入额外的条件信息来指导图像的生成。原创 2024-09-25 13:36:00 · 676 阅读 · 0 评论 -
nvidia-smi 输出内容详解
nvidia-smi(NVIDIA System Management Interface)是一种命令行实用程序,主要用于监控和管理NVIDIA GPU(图形处理器)的状态和性能。它提供了一个简单而强大的方式来获取有关GPU的实时信息,这些信息包括GPU的使用情况、温度、内存占用等,同时也支持进行一些基本的管理操作。在大多数情况下,nvidia-smi是与NVIDIA GPU驱动程序一起安装的。原创 2024-04-23 11:14:32 · 1632 阅读 · 0 评论 -
Pytorch 的 LSTM 模型的简单示例
Pytorch 的 LSTM 模型的简单示例原创 2023-05-28 17:43:39 · 7697 阅读 · 2 评论 -
如何检查 Pytorch 所使用的 Cuda 版本?
这个命令将返回当前PyTorch安装所使用的CUDA版本。如果返回值为None,那么PyTorch并未使用CUDA。请注意,如果您同时安装了多个CUDA版本,则PyTorch将使用其中的一个版本。在这种情况下,建议您先通过nvcc -V命令检查各版本CUDA的版本号,并确认PyTorch使用的是您所期望的版本。原创 2023-05-28 16:29:44 · 5896 阅读 · 0 评论 -
构建seq2seq模型的常见问题
构建seq2seq模型的常见问题。原创 2023-05-28 14:59:09 · 1428 阅读 · 0 评论 -
利用 Pytorch 加载词向量库文件
加载词向量两以及使用词向量的例子。原创 2023-05-27 13:18:22 · 1315 阅读 · 0 评论 -
pytorch 提供了几个子模块?
以上是PyTorch主要的子模块,每个子模块又包含多个子模块和功能。原创 2023-05-25 10:21:42 · 213 阅读 · 0 评论 -
GPT4生成的 MNIST 算法模型和后续的改进实验
用 GPT4 生成了 MNIST 算法模型。第一个模型,查找一下,发现于某教材内容几乎完全一样。感觉这家伙肯定后台参考了某个现成的数据库。重新生成了一个,感觉结构有些奇葩,而且有个别错误,稍作调整,训练一下,准确率大约 82%。运行了一下,精度 85%。原创 2023-05-24 16:47:36 · 502 阅读 · 0 评论 -
Pytorch 中如何对训练数据进行增强处理?
假设我们的数据集是一个手写数字的图像数据集,其中每一张图像包含一个手写数字和对应的标签。我们可以通过随机旋转、平移、缩放和翻转等操作,对原始的图像进行变换增广(Data Augmentation)以增强模型的训练效果。然后,我们可以利用这个变换来对原始数据集进行处理,生成一个新的增广后的数据集。在实际使用过程中,可以将多个变换组合起来,以更大程度地提高模型的性能。操作来随机对图像进行旋转,最大旋转角度设置为30度,并将图像转换为。在上面的代码中,我们首先定义了一个。变换,其中包含了一个。原创 2023-05-24 16:34:53 · 519 阅读 · 0 评论 -
Pytorch 中张量的数据结构
它是 PyTorch 广泛使用的核心数据结构,用于表示神经网络中的数据,包括输入数据,参数以及梯度等。与 NumPy 中的 ndarrays 类似,PyTorch 张量也可以进行类似的数学和操作。需要注意的是,对原始张量进行 reshape 操作实际上可以看作在内存中设法切割/拼接数据来新建一个张量对象,并不影响原始张量。我们还可以通过各种张量操作来改变张量的形状、增删元素以及级联此类更高级的数据转换。分别创建了两个张量,并打印出了这些张量的形状、数据类型和存储设备等属性信息。上述代码中首先通过调用。原创 2023-05-23 09:28:57 · 345 阅读 · 0 评论 -
torchvision.datasets.MNIST 的数据结构
对于 MNIST 数据集中的每一个图像, torchvision.datasets.MNIST 返回一个由两个元素组成的元组。第一个元素是 PIL.Image.Image 对象类型的图像,表示该图像的像素矩阵。而第二个元素则是一个整数,表示该图像所代表的数字。MNIST 数据集包含了大量的手写数字图像,每个图像都是 28 x 28 像素大小的灰度图像。通过这些代码,我们可以看到 MNIST 数据集中的每个样本都是一个尺寸为(1, 28, 28)的张量,其中 1 表示普通的灰度图像。原创 2023-05-23 09:26:06 · 1307 阅读 · 0 评论 -
MNIST手写体识别训练过程数据流图
MNIST手写体识别训练过程数据流图。原创 2023-05-23 09:20:38 · 259 阅读 · 0 评论 -
词向量文件格式
表示“apple”这个单词被表示为一个300维的向量,向量中第1个元素为0.1,第2个元素为-0.2,以此类推。词向量文件是一种将文本中的词语或字符表示为向量的方式,它通常用于自然语言处理任务中。在词向量文件中,每个词或字符都被表示为一个向量,而这些向量则被组织成一个矩阵。第二行:文件中所包含的词汇量和向量维度数,通常是用空格分隔,例如“100000 300”表示该文件中包含10万个词,每个词用300维向量来表示。需要注意的是,不同的词向量模型可能有不同的格式要求,但一般遵循上述的基本格式。原创 2023-05-22 19:38:08 · 281 阅读 · 0 评论 -
torch、torch.nn、 torch.optim、torchvision、 torchvision.transforms 功能简介
命令将 PyTorch 框架导入到 Python 程序中,这样我们就可以使用 PyTorch 提供的各种功能了。PyTorch 是一个用于科学计算的机器学习库,具有以下重要功能:张量(Tensor)操作:PyTorch 引入了张量作为其核心数据结构,对张量进行各种操作(如加、减、乘、除、矩阵乘法、转置等)。自动求导:PyTorch 具有自动求导系统,能够自动计算输入变量关于输出变量的导数,并将反向传播算法应用于神经网络中。原创 2023-05-22 18:42:57 · 3626 阅读 · 0 评论 -
在 C++ 中使用 PyTorch
PyTorch 提供了 C++ 前端 API 接口,可以直接在 C++ 中使用 PyTorch 的相关功能。您可以使用 C++ API 在 C++ 代码中构建、训练和部署深度学习模型。6.使用 C++ API 加载和运行 Torch Script 模型或使用 ONNX Runtime 加载和运行 ONNX 模型。上述代码实现了一个使用 C++ API 训练 MNIST 数字识别模型并在每 100 批次后输出损失值的示例。4.在训练周期中使用 C++ API 优化模型。原创 2023-05-22 16:19:47 · 2751 阅读 · 0 评论 -
重写 MNIST 手写体识别模型,并启用多块 GPU并行计算
可惜在我用的服务器上不能运行,程序卡死在训练过程。咨询了一下,原因是我的服务器安装了 8 块K80显卡,由于卡之间通讯问题,不能这样使用。据说,K80 只能同时选择偶数序号卡或奇数序号卡。指定了第 0 块卡。测试了一下,可以运行。原创 2023-05-22 15:14:07 · 541 阅读 · 0 评论 -
关于机器学习(深度学习)训练过程中 batch_size 的意义
batch_size表示每个训练批次的样本数量。在训练神经网络模型时,通常需要将很多样本输入到模型中进行计算得到损失函数,然后利用反向传播算法来更新模型的参数。如果每次只输入一个样本进行计算,会大大增加训练时间和GPU显存的使用量,同时也可能导致训练过程不够稳定。因此,我们通常选择将一定数量的样本作为一个batch输入到模型中进行计算。而batch_size的大小则影响了模型参数的更新速度和训练效果。较小的batch_size可以提升参数更新的速度,但容易受到随机性较大的噪声干扰,导致训练过程波动较大;原创 2023-05-22 10:41:03 · 922 阅读 · 0 评论 -
关于PyTorch中的 torch.utils.data.DataLoader
torch.utils.data.DataLoader是PyTorch中一个用于数据加载的工具类,主要用于将样本数据划分为多个小批次(batch),以便进行训练、测试、验证等任务。该类支持多线程异步数据读取和数据预处理,使得模型训练更高效、更快速。使用DataLoader时需要传入一个Dataset对象,Dataset对象提供了访问样本数据的接口。例如,可以使用PyTorch提供的torchvision.datasets中的一些内置数据集(如MNIST、CIFAR-10等)来构建Dataset对象。原创 2023-05-22 09:05:21 · 1141 阅读 · 0 评论 -
在 windows 下如何安装 pytorch?
安装完成后,可以通过创建一个 Python 脚本来测试 PyTorch 是否正确安装。这个命令会安装 PyTorch 1.8.1、torchvision 0.9.1 和 torchaudio 0.8.1.运行这个脚本并检查输出是否为 PyTorch 的版本号,如果输出正确则 PyTorch 安装成功。在 Windows 上安装 PyTorch 可以使用 pip 或 conda 管理包。希望这些步骤能够帮助您成功安装 PyTorch。打开命令提示符或 PowerShell;原创 2023-05-21 15:19:54 · 1015 阅读 · 0 评论 -
Python 中的函数微分是如何实现的?
可以使用 PyTorch 中的自动微分功能来计算函数的导数。在这个例子中,我们定义了一个函数fxx22x1,创建了一个张量x,并且将 requires_grad 设置为 True,表示要对x求导。然后,我们计算了函数在x2处的值yf2,并通过计算了y对x的导数。最后,通过查看x的grad属性,可以得到y对x的导数值,即2x2gradyx∣x26。在实际的使用中,如果我们需要求一个向量值函数的梯度,则只需要对每个变量设置。原创 2023-05-20 18:59:32 · 1155 阅读 · 0 评论 -
torch.utils.data.DataLoader 的功能
支持多种数据集,如 TensorDataset,ImageFolder 等,并且可以根据需要自定义数据集。,我们可以方便地将自己的数据集传入,并在训练时对其进行批量化处理,另外还可以通过自定义。函数来实现对每个 batch 中数据的转换。原创 2023-05-20 16:46:30 · 1247 阅读 · 0 评论 -
word2vec、GloVe、LSA算法的共同特点和区别和优缺点
Word2vec是一种基于神经网络的模型,它通过训练一个前馈神经网络,学习到词汇在向量空间上的表示。GloVe是一种基于全局统计信息和矩阵分解的模型,它通过对整个语料库中的词汇共现矩阵进行矩阵分解,得到词汇的向量表示。LSA是一种基于奇异值分解的模型,它将所有词汇表示为文档-词矩阵的奇异值分解结果。Word2vec和GloVe具有更好的扩展性,而LSA的计算量较大。Word2vec、GloVe和LSA都是常见的词向量表示算法,它们的共同点是都是将词汇表示为低维空间向量,并用这些向量来描述词汇之间的关系。原创 2023-05-19 11:07:46 · 599 阅读 · 0 评论 -
公开的中文语料库有哪些?
中文情感分析数据集ChnSentiCorp:包含正面、负面和中性情感的中文文本数据,适用于情感分析任务。开放中文词库OpenCC:提供包括简体中文、繁体中文和粤语在内的多种语言版本的中文分词和转换词库。以上仅是一部分常用的公开中文语料库,还有其他一些数据集如人民日报、新华社、搜狗实验室等也值得关注。中文Gigaword数据集:包含新闻、杂志和网页等语料,适用于自然语言处理任务。THUCTC中文文本分类数据集:包含20个分类别的中文文本,适用于文本分类任务。中文维基百科:包含大量的中文文章,非常全面和丰富。原创 2023-05-17 14:27:46 · 2156 阅读 · 0 评论 -
词向量语义匹配:欧氏距离和余弦相似度,选择哪一个?
最近做自然语言处理算法,需要根据词向量判断两个词汇的相似度。面临两个选择:欧氏距离和余弦相似度。选择哪一个好呢?原创 2023-03-08 11:41:42 · 1668 阅读 · 0 评论 -
我发现 chatGPT 在智能客服方面一个逆天的应用呀
chatGPT 有助于快速构建知识库,想了一个有趣的例子,感觉 chatGPT真是强大呀!原创 2023-02-02 11:37:27 · 898 阅读 · 0 评论 -
ChatGPT 逆天测试,结局出乎预料
问几个逆天的问题,看看能否把 ChatGPT 逼疯。结果出乎预料,震惊呀!原创 2023-01-31 12:40:12 · 7911 阅读 · 0 评论 -
TensorRTx 开源代码内容说明
TensorRTx 提供了把常见网络模型转化为 TensorRT 格式的功能。TensorRTx旨在使用tensorrt网络定义API实现流行的深度学习网络。tensorrt有内置的解析器,包括caffeparser、uffparser、onnxparser等,当我们使用这些解析器时,我们经常遇到一些“不受支持的操作或层”问题,特别是一些最先进的模型正在使用新类型的层。那么我们为什么不跳过所有的解析器呢?我们只使用TensorRT网络定义API来构建整个网络,并不复杂。原创 2022-09-07 17:47:29 · 1370 阅读 · 0 评论 -
准确率(Accuracy)、精度(Precision)、召回率(Recall)和 mAP 的图解
机器学习的评价指标让人眼花缭乱。今天修改一份标准文件,发现算法测试指标定义有些不妥。反复思考后,感觉有必要再次梳理一下对这些概念的认识。原创 2022-07-30 12:16:26 · 7509 阅读 · 0 评论 -
Cifar-10 数据格式分析
Cifar-10 的介绍可去官网阅读,也可参照我之前整理的《笔记:CIFAR-01 和 CIFAR-100 数据集内容和格式详解》1. 下载 Cifar-10 数据本文下载了 Cifar-10 的 Python 语言版本,解压后放在文件夹:...\cifar-10-python\cifar-10-batches-py 中。其中包含如下文件:2. 读取 Cifar-10 数据按照官网说明,这些数据可以用如下 Python 代码读取:def unpickle(file): import pi原创 2022-05-31 08:54:08 · 1472 阅读 · 1 评论 -
一分钟看懂深度学习中的准确率(Accuracy)、精度(Precision)、召回率(Recall)和 mAP
1. 真假阳性阴性我们查体的时候,经常会听说检测结果呈”真阳性“、”假阴性“等说法。其中”真“、"假"说的是检查结果的对错。”真“意味着检测结果是正确的,"假"意味着检测结果是错误的。”阳性“、"阴性"说的是这次的检查结果。阳性,意味检测出了预定的目标。阴性,意味着没查出预定的目标。一共四种组合:检测结果英文术语含义真阳性true positive正确地检测到阳性结果:即检测结果正确,并且结果呈现阳性假阳性false positive错误地检测到阳性结果:即原创 2021-11-23 20:10:41 · 46591 阅读 · 7 评论 -
人工智能本质上就是数学最优化方法吗?
最近,发现经常有客户对我们的产品提出质疑,你们所谓的AI,不就是数学最优化方法吗,我们怎么没看到智能呢?AlphaGo也好,人脸识别也好,人们发现在当今比较火的人工智能技术背后都有一个重要角色——神经网络。仔细研究神经网络,发现,神经网络原来是借助数学最优化方法生成的。于是,很多人不约而同的出一个结论,人工智能本质上就是数学最优化方法。果真如此吗?原创 2021-06-16 14:42:51 · 1056 阅读 · 0 评论 -
英伟达 Jetson Nano 新手必备:Hello AI World —— 部署深度学习开发环境
Hello AI World! —— 部署深度学习1. Hello AI World1.1 系统安装1.2 推理1.3 训练1.4 附录2. 视频演练3. API 参考4. 代码示例5. 预训练模型6. 推荐系统要求7. 额外资源8. 两天的演示(数字)欢迎使用我们的教学指南,了解NVIDIA Jetson Nano/TX1/TX2/Xavier NX/AGX Xavier的推理和实时DNN视觉库]。此 repo 使用 NVIDIA TensorRT 将神经网络有效地部署到嵌入式 Jetson 平台上,原创 2021-03-24 15:27:10 · 3892 阅读 · 0 评论 -
处理:./src/cuda.c:36: check_error: Assertion `0‘ failed.
运行$ ./darknet detect cfg/yolov3.cfg yolov3.weights data/dog.jpg出错,因为 cfg 文件默认参数是用于 Training 的,把下面的注释掉,把 Testing 部分的参数注释 # 号去掉,即可。 yolov3.cfg 文件修改如下:[net]# Testingbatch=1subdivisions=1# Training# batch=64# subdivisions=8... ......原创 2021-01-30 17:05:54 · 860 阅读 · 0 评论 -
处理:./src/image_opencv.cpp:131:20: error: ‘CV_CAP_PROP_FRAME_WIDTH’ was not declared in this scope
把 CV_ 前缀去掉,因为 OpenCV4以上的版本,把这个常量名称前面的 CV_ 给去掉了。原创 2021-01-30 14:56:29 · 1969 阅读 · 0 评论 -
处理:‘IplImage’ does not name a type; did you mean ‘image’?
编译 darknet 的时候出现这个错误,把 home/darknet/src/imageopencv.cpp 修改如下:#ifdef OPENCV#include "stdio.h"#include "stdlib.h"#include "opencv2/opencv.hpp"#include "image.h"using namespace cv;extern "C" {/*IplImage *image_to_ipl(image im){ int x,y,c;原创 2021-01-30 14:48:14 · 2815 阅读 · 2 评论 -
终于解决:CUDA: OpenCV requires enabled ‘cudev‘ module from ‘opencv_contrib‘
用 cmake-gui 配置 WITH_CUDA 时出现这个错误提示。CMake Error at modules/core/CMakeLists.txt:40 (message): CUDA: OpenCV requires enabled 'cudev' module from 'opencv_contrib' repository: https://github.com/opencv/opencv_contrib按照错误提示解决方案提供的网址:https://github.com/ope原创 2021-01-27 12:35:09 · 10652 阅读 · 2 评论