自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 简单记录一下cuda配置环境

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。cuda下载就不说了,注意的是先搞清自己电脑最高支持版本。3、添加如下俩路径(安装时默认路径,不建议修改)

2024-04-02 12:48:13 1315 1

原创 运行stable-diffusion出现的问题

解决:即用 https://github.com/CompVis/taming-transformers/blob/master/taming/modules/vqvae/quantize.py 新文件,替换错误提示文件中的全部内容即可。5.新建文件夹 CompVis/stable-diffusion-safety-checker/将下载的四个文件放入 解决!后面还会遇到'openai/clip-vit-large-patch14离线下载的问题,同样步骤解决。解决:下载后离线,步骤如下。

2024-04-01 22:11:23 1995 3

原创 学习笔记(二)----diffusion model

(本文介绍的diffusion Model 是论文:Denoising Diffusion Probabilistic Models(DDPM)去噪扩散概率模型,DDPM是2020年提出,是AIGC主流生成模型)我们可以看到最近很火的text-to-image,通过给定文本描述生成图片,当前最先进的两个text-to-image是OpenAI的DALL E2和Google的Imagen,他们都是基于扩散模型来完成的。什么是扩散模型?|Lil'Log的 (lilianweng.github.io)

2024-04-01 16:29:28 1563

原创 学习笔记(一)----CLIP

是一种基于对比学习的多模态模型,它的训练数据是 文本-图像对(例如:这是一只狗+狗图)。通过对比学习,让模型学到文本-图像的对应关系。为了训练CLIP,OpenAI从互联网收集了共4个亿的文本-图像对,论文称之为WebImageText。训练完成的CLIP模型可以直接迁移到自己的任何数据集上,完全不需要图像标签微调即可实现zero-shot分类。

2024-03-27 20:14:47 1426

原创 conda create出现CondaHTTPError问题

【代码】conda create出现CondaHTTPError问题。

2024-03-27 15:52:14 369

原创 Q:linux配置新的python环境

原来python版本3.6,没法安装tensorflow==2.9.1,需要python版本3.9。

2024-03-27 10:21:46 271

原创 安装完PyQt5去哪找Qtdesiner

2023-03-29 21:11:44 157

原创 pycocotools怎样在windows安装

什么都不需要直接成功。

2023-01-09 23:12:56 217

原创 Day3:玄学多分类调参过程

调参心路

2022-08-12 13:58:01 526

原创 Day2:Alexnet训练自己的数据集--多分类

多分类

2022-08-10 10:21:10 740

原创 【无标题】New1:利用Alexnet训练自己的数据集

基于Alexnet训练自己数据集

2022-08-01 21:49:13 359

原创 DAY8:Faster-R-CNN简单理解

一、Faster-R-CNN经过R-CNN和Fast-R-CNN的积淀,Ross B. Girshick在2016年提出了新的Faster RCNN,在结构上,Faster RCNN已经将特征提取(feature extraction),proposal提取,bounding box regression(rect refine),classification都整合在了一个网络中,使得综合性能有较大提高,在检测速度方面尤为明显。Faster R-CNN最突出的贡献就在于提出了Region Propo

2021-09-05 10:56:38 219

原创 DAY7:ResNet网络结构分析

一、ResNet二、创新三、结构分析四、代码实现参考:

2021-08-27 16:56:12 477

原创 DAY6:VGG网络结构分析

一、VGG网络VGG模型是2014年ILSVRC竞赛的第二名,第一名是GoogLeNet。但是VGG模型在多个迁移学习任务中的表现要优于googLeNet。VGG是在从Alexnet发展而来的网络,VGG共有十九层(16+3),一共有五段卷积每段卷积之后紧接着最大池化层(整个网络都使用了同样大小的3*3卷积核尺寸和2*2最大池化尺寸,网络结果简洁),三层全连接层最后接一个softmax,所有隐层的激活单元都采用ReLU函数。VGG最大的贡献就是证明了卷积神经网络的深度增加和小卷积核的使用对网络的最终

2021-08-26 14:47:56 1307

原创 Day5:Googlenet网络理解

一、Googlenet简介GoogLeNet是2014年Christian Szegedy提出的一种全新的深度学习结构,在这之前的AlexNet、VGG等结构都是通过增大网络的深度(层数)来获得更好的训练效果,但层数的增加会带来很多负作用,比如overfit、梯度消失、梯度爆炸等。inception的提出则从另一种角度来提升训练结果:能更高效的利用计算资源,在相同的计算量下能提取到更多的特征,从而提升训练结果。二、Googlenet创新点【通过增加网络深度和宽度来获得高质量模型存在的两个问题:一

2021-08-17 18:07:23 479

原创 DAY4:AlexNet网络简介

一、AlexNet网络AlexNet是2012年ImageNet竞赛冠军获得者Hinton和他的学生Alex Krizhevsky设计的。AlexNet将LeNet的思想发扬光大,把CNN的基本原理应用到了很深很宽的网络中,其中引入了很多创新点(将在铺垫知识详细介绍)因此具有更强的图像处理效果。二、铺垫知识(一)ReLU(二)LRN(三)Dropout(四)GPU(五)Overlapping Pooling三、网络框架四、代码实现...

2021-08-13 20:30:16 494

原创 DAY3:LeNet网络架构简介

一、LeNet介绍LeNet5诞生于1994年,是最早的卷积神经网络之一,是Yann LeCun等人在多次研究后提出的最终卷积神经网络结构,是一种用于手写体字符识别非常高效的网络。一般LeNet即指代LeNet-5。LeNet网络包括了深度学习的基本模块:卷积、池化、全连接层。二、LeNet网络架构LeNet-5由七层组成(不包括输入层),每一层都包含可训练权重。通过卷积、池化等操作进行特征提取,最后利用全连接实现分类识别,下面是他的网络结构示意图:C:卷积层S:池化层F:全连接

2021-08-10 20:56:09 3446 1

原创 DAY2:Fast R-CNN简介

一、什么是Fast R-CNNFast R-CNN(Selective Search + CNN + ROI)也是候选区域/框 + 深度学习分类:通过提取候选区域,并对相应区域进行以深度学习方法为主的分类的方案。二、Fast R-CNN与R-CNN区别1、Fast R-CNN仍然使用VGG16作为网络的backbone,与R-CNN相比,训练时间快9倍,测试推理时间快213倍,准确率从62%提升到66%。2、R-CNN是将2000个候选框输入提取特征,而Fast R-CNN是将整张图片输入进

2021-08-02 16:39:08 560 1

原创 DAY1:RCNN简介

一、什么是RCNNR-CNN全称是Region-CNN,将候选区+ CNN结合,是第一个成功将深度学习应用到目标检测上的算法,从而提高目标检测效果。二、与传统目标检测区别R-CNN总体遵循传统目标检测流程,区别在于特征提取一步,将传统目标检测特征提取(Harris、SIFT、SURF、LBF)改成卷积神经网络来进行特征提取。三、R-CNN算法流程(一)生成候选区域(二)特征提取(三)类别判断(四)精修位置(一)生成候选框论文主要利用selective sea...

2021-07-27 15:20:36 1030 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除