
3—DL(deep learning)深度学习
文章平均质量分 77
深度学习
点亮~黑夜
人工智能领域资深专家
本博客主要分享linux、python、人工智能、SLAM(主要是计算机视觉:目标检测、图像分割、人脸识别、GAN等)等前沿技术。同时大家相互交流的机会,疑难杂症、程序bug等等问题
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
目标检测使用LabelImg标注VOC数据格式和YOLO数据格式——LabelImg使用详细教程
VOC标签格式,标注的标签存储在xml文件YOLO标签格式,标注的标签存储在txt文件中点我,带你去>原创 2024-11-22 16:06:16 · 1140 阅读 · 0 评论 -
解决git提示Permission denied (publickey)
生成密钥: ssh-keygen -t rsa -C “tx” tx 可以换成你想要的其他的名字。把生成的输入到github的 setting->SSH and GPG keys 下的key中即可。有需要输入的直接enter跳过就可以,不用设置密码,要不以后每次clone都要输入密码,麻烦。2. 命令行下输入: cat /home/shl/.ssh/id_rsa.pub。原创 2024-11-12 09:25:02 · 367 阅读 · 0 评论 -
献给新手的深度学习综述
文章目录1. 引言2. 相关研究3. 最新进展3.1 深度架构的演变4. 深度学习方法4.1 深度监督学习4.2 深度无监督学习4.3 深度强化学习5. 深度神经网络5.1 深度自编码器5.1.1 变分自编码器5.1.2 多层降噪自编码器5.1.3 变换自编码器5.2 深度卷积神经网络5.2.1 深度最大池化卷积神经网络5.2.2 极深的卷积神经网络5.3 网络中的网络5.4 基于区域的卷积神经网络5.4.1 Fast R-CNN5.4.2 Faster R-CNN5.4.3 Mask R-CNN5.4.4原创 2024-11-12 09:24:47 · 1136 阅读 · 0 评论 -
深度学习面试大题
对图像(不同的数据窗口数据)和滤波矩阵(卷积核)(一组固定的权重:因为每个神经元的多个权重固定,所以又可以看做一个恒定的滤波器filter)做内积(逐个元素相乘再求和)的操作就是所谓的『卷积』操作,也是卷积神经网络的名字来源。原创 2024-11-12 09:24:32 · 1036 阅读 · 0 评论 -
深度学习资源推荐
【代码】深度学习资源推荐。原创 2024-11-12 09:24:16 · 209 阅读 · 0 评论 -
深度学习笔试100题
在 A 选项中,m∗n 的矩阵 A 和n∗p的矩阵 B 的乘积,得到 m ∗ p的矩阵 A * B ,而 A ∗ B的每个元素需要 n 次乘法和 n-1 次加法,忽略加法,共需要 m∗n∗p次乘法运算。深度神经网络的成功, 已经证明, 增加神经网络层数, 可以增加模型范化能力, 即, 训练数据集和测试数据集都表现得更好. 但更多的层数, 也不一定能保证有更好的表现(https://arxiv.org/pdf/1512.03385v1.pdf). 所以, 不能绝对地说层数多的好坏, 只能选A。原创 2024-11-12 09:24:03 · 1500 阅读 · 0 评论 -
深度学习开源数据集
自己上面的链接中去找吧,我就不截图啦,我的网页截图工具,这个傻子让我开会员,一个月几十刀,算啦!这里这里的很多深度学习的数据集,涵盖了图像、语音、文本、3D视觉等数据集。原创 2024-11-12 09:23:35 · 216 阅读 · 0 评论 -
深度学习可视化工具visdom使用
visdom的github主页visdom中文文档参考Visdom是一个灵活的工具,用于创建组织和共享实时丰富数据的可视化TorchNumpyVisdom的目标是促进(远程)数据的可视化,重点是支持科学实验。视频图像文本等的可视化。通过编程或通过UI组织可视化空间,为实时数据创建仪表板,检查实验结果,或调试实验代码。原创 2024-11-12 09:23:08 · 1929 阅读 · 0 评论 -
开源活体检测
在人脸识别技术越来越普及的时代,活体检测突然变得异常重要。尤其鉴权类应用,比如门禁、银行贷款审核、考勤打卡等都需要人脸识别系统能够防恶意攻击。地址:http://chalearnlap.cvc.uab.es/workshop/32/description/活体检测目前已经应用很广,在安防和支付等领域应景很普及了,下面介绍两篇比较好的活体检测论文和项目。开源github地址:【开源github地址:【原创 2024-11-12 09:21:50 · 328 阅读 · 0 评论 -
基于Yolov4的人群检测,人群距离估计、基于SORT的多目标跟踪及逆透视映射一体的系统Yolov4_DeepSocial
本文的主要贡献:该研究旨在通过自动监测和检测个人之间的社交距离违反行为的人工智能解决方案,为减少新冠病毒的传播和经济成本提供支持。我们开发了最精确(如果不是最精确)的深度神经网络(DNN)模型之一,用于人类检测跟踪和距离估计,称为DeepSOCIAL。我们通过对现场人员移动的时空数据进行分析,进行实时和动态的风险评估。开发的模型是通用的人体检测和跟踪器,不局限于社交距离监测,可以应用于各种现实世界的应用,如自动驾驶汽车中的行人检测人体动作识别异常检测和安全系统。1、行人检测。原创 2024-11-12 09:21:07 · 653 阅读 · 0 评论 -
在NVIDIA Jetson Xavier NX上把yolov4-deepsort的模型pb模型使用tensorflow-onnx和onnx-tensorrt工具最终转换为tensorrt模型
文章目录1 安装tensorflow-onnx环境和把tensorflow的pb模型转换为onnx模型1.1 安装tensorflow2onnx环境1.2 把tensorflow的pb模型转换为onnx模型1.2.1 把tensorflow的pb模型转换为onnx模型1.2.2 转可能报错1:OSError: SavedModel file does not exist at: checkpoints//{saved\_model.pbtxt|saved\_model.pb}1.2.3 转可能报错2:`Va原创 2024-11-11 09:23:42 · 1214 阅读 · 0 评论 -
在NVIDIA Jetson Xavier NX上安装llvm和numba,以及在Jetxon NX上跑通CenterTrack的目标跟踪模型
https://blog.youkuaiyun.com/zt1091574181/article/details/108222306 # 从编译好的文件。安装llvlite之气,首先要查看一下你要安装的llvmlite的版本和llvm版本,因为他们之间有着对应关系,如下是。的缩写,就是关于线程的一个模块,而我们安装的numba是依赖这个模块的,因此需要先把这个TTB版本过低的问题解决!:https://www.jianshu.com/p/ccaf688f54c0 # 解决安装过程中的错误。原创 2024-11-11 09:23:22 · 976 阅读 · 0 评论 -
图像的评价指标之SSMI——结构相似性
https://blog.youkuaiyun.com/chaipp0607/article/details/70158835https://zhuanlan.zhihu.com/p/46059954原创 2024-11-11 09:23:03 · 271 阅读 · 0 评论 -
使用最新目标跟踪框mmtracking实现自己的目标跟踪项目
持续更新中......原创 2024-11-11 09:22:37 · 798 阅读 · 0 评论 -
使用deepsort重新训练自己的多目标跟踪模型,以及Market1501和MARS数据集的介绍
deepsort是用于目标跟踪的一个项目1、deep_sort 的github官网deep_sort 的github官网。原创 2024-11-11 09:22:15 · 858 阅读 · 0 评论 -
从R-CNN到Mask R-CNN
其中在图像检测的任务中,R-CNN系列是一套经典的方法,从最初的R-CNN到后来的Fast R-CNN, Faster R-CNN 和今年的Mask R-CNN, 我们可以看到CNN在图像检测中是如何一点一点提高的。图像的检测任务是从一个复杂场景的图像中找到不同的物体,并且给出各个物体的边界框。这两个网络的前几层都要计算卷积,如果让它们在这几层共享参数,只是在末尾的几层分别实现各自的特定的目标任务,那么对一幅图像只需用这几个共享的卷积层进行一次前向卷积计算,就能同时得到候选区域和各候选区域的类别及边框。原创 2024-11-11 09:21:56 · 825 阅读 · 0 评论 -
YOLOv5的详细使用教程,以及使用yolov5训练自己的数据集
从结果可以看到,置信度还是很高的,而且目标都检测到了!(保存的结果图片,会把上一此保存的测试结果图删了,最终只保存最后一侧测试的结果图)选择好模型之后,如果你使用的不是coco数据集进行训练,而是自定义的数据集,此时只需要修改。,没有自己的视频服务器,如果上传还需要等待审核,比较慢,我我就直接放个gif动图,大家简单看下效果吧,又由于。数据的一部分,只取了coco数据集中的128张标注的图片,coco128.zip下载完后解压到。准备好上面的环境和下载好文件之后,就可以开始自定义自己的数据集,进行训练啦!原创 2024-11-11 09:21:35 · 970 阅读 · 0 评论 -
windows错误:Failed to import pydot. You must install pydot and graphviz for `pydotprint` to work.
下载graphviz安装包,要去https://graphviz.gitlab.io/下载windows版本的安装包,安装好之后在环境变量中添加对应的路径即可!这种解决方式在windows下不行,在其他平台下可以。4、重启你的terminal或者编辑器。在windows下不可以使用。2、安装pydotplus。1、下载graphviz。原创 2024-11-11 09:21:15 · 402 阅读 · 0 评论 -
Tensorflow-gpu安装
因为想在Tensorflow-gpu 上跑Faster-rcnn,以前在Ubuntu16.04上跑过caffe的faster-rcnn(搭建过程可以参考以前的文章),但是在新的笔记本上装双系统后,在Ubuntu16.04上,显卡驱动始终安装不成功,折腾了两三天没办法,退而求其次,打算在Windows10+Tensorflow-gpu 搭建Faster-rcnn,依然是一路坑,一路泪啊。虽然Python 3有许多优于Python 2的特性,但是Python 2的生态系统更为完善,支持的包更多。原创 2024-11-11 09:20:40 · 1286 阅读 · 0 评论 -
SVD奇异值分解
奇异值分解(Singular Value Decomposition,SVD)是一种矩阵分解(Matrix Decomposition)的方法。除此之外,矩阵分解还有很多方法,例如特征分解(Eigendecomposition)、LU分解(LU decomposition)、QR分解(QR decomposition)和极分解(Polar decomposition)等。这篇文章主要说下奇异值分解,这个方法在机器学习的一些算法里占有重要地位。原创 2024-11-11 09:20:22 · 892 阅读 · 0 评论 -
Real-Time-Voice-Cloning的使用教程
你可以自由地不下载任何数据集,但是您将需要自己的数据作为音频文件,或者必须使用工具箱记录下来。,其中<datasets_root>是您选择的目录。如果测试通过,没有报错则表示环境没有问题,当然该步骤是可选的,你也可以不测试!目前,作者提供的是只支持英语,其他语言的训练应该也是支持的,可以看。,如果你已经下载了数据集,可以用如下的命令。对于仅使用工具箱的情况,仅仅建议下载。1、官方给出的预训练模型下载连接。如果你没有下载数据集,直接运行。2、下载打包好的预训练模型。模型,直接解压即可!3、再次运行错误解决。原创 2024-11-11 09:19:57 · 1296 阅读 · 0 评论 -
Pytorch用tensorboarX查看损失图打不开
把软件退出,然后问题就可以解决啦!在浏览器中打开服务地址,显示该网页无法正常运作。命令行中正确的返回服务地址。原创 2024-11-11 09:19:20 · 336 阅读 · 0 评论 -
NVIDIA Jetson Xavier NX安装torch和torchvision
1、查看torchvision和torch的版本对应关系。2、直接使用pip3安装torchvision(报错)1、首先使用查看有哪些torchvision版本。3、正确安装torchvision的方式。,这个就是0.7.0版本,安装这个就可以。2、查看到有torchvision的。其他版本自己去上面的官网地址查看那。3、下面是安装torch的具体过程。如果你直接安装,会提示你没有。2、下载torch安装包。安装torch直接参考。原创 2024-11-11 09:19:02 · 1675 阅读 · 0 评论 -
mmdetection2.3.0版本安装过程,以及训练、测试、可视化等(亲测好用,很顺利)
截至:20200805 mmdetection/mmdet/version.py中定义的。吧,毕竟有些错误经验跟不上官网的更新速度!从训练损失可以看,还可以继续下降,可以。,因此下载最新的版本的代码就必须安装。我尝试在我之前的环境中运行最新的。3、编译,编译的时间稍微有一点久。这种方法没有解决我的问题,然后有。,然后我去官网的仓库看了下,对于。中并没有这个函数,在最新版本的。,然后就报错呀,报错呀!然后把mmcv版本更新到。由于官网提供的这个库包是。请放弃它,不要跟它多BB。原创 2024-11-11 09:18:24 · 1363 阅读 · 0 评论 -
Kaggle从入门到实战教程(新手必备)
,其实是相当于数据存放的文件夹(即默认会创建一个以这个标题的文件夹,并把上传的数据放到这个文件夹中),如上图所我上传的文件是。(如图左下角所示)。2、直接使用kaggle上现有的数据集,当然它也是需要下载的,但是相对自己本地是数据集比较快一点。无奈,只能够重新上传所有的文件和代码了,希望有知道如何解决这个问题的童鞋,能够给予帮助!上传的数据只可读,是真的烦,后面我想改要改一行代码,都要把所有的数据都重新上传一次,,但是实时证明这样是访问不到文件的,当我列举了当前文件夹下的文件时,发现显示的是。原创 2024-11-11 09:17:46 · 9712 阅读 · 0 评论 -
face2face-demo
报错,可能是tensorflow-gpu版本 和 pix2pix-tensorflow代码不对应造成的。在2017.12的时候,pix2pix用的tensorflow版本改成1.4.1了。在2017.4的时候,pix2pix用的是tensorflow1.0.0。用tensorflow1.0.0和。原创 2024-11-10 19:23:19 · 372 阅读 · 0 评论 -
DPSR介绍
testsets/real_imgs/LR尺寸testsets/real_imgs/x4_dpsr尺寸testsets/Set5/GT 图片:GTx2x3x4/testsets/BSD68├─GT├─x4_d├─x4_g├─x4_m。原创 2024-11-08 10:51:50 · 221 阅读 · 0 评论 -
DL-5 深度学习框架的对比
在深度学习领域的五大巨头里,它们都各自力挺一种深度学习框架:像谷歌有自家的TensorFlow、Facebook有Torch、百度有Paddle Paddle、微软有CNTK、而亚马逊的AWS则有MXNet,现在还有支持HADOOP的NL4J深度学习框架。 表1.1 是五大主流深度学习框架概要对比表。每种框架都有其优缺点,选择的时候更加需要根据自身业务的实际需求。例如需要用到对时间序列分析的,那么就会使用循环神经网络RNN,而Caffe、MXNet就是对图像卷积处理非常友善而缺乏循环神经网络,Googl原创 2024-11-08 10:51:07 · 1016 阅读 · 0 评论 -
DL-4 深度学习中的batch_size、epoch、iteration的区别
batch的思想,至少有两个作用,一是更好的处理非凸的损失函数,非凸的情况下, 全样本就算工程上算的动, 也会卡在局部优上, 批表示了全样本的部分抽样实现, 相当于人为引入修正梯度上的采样噪声,使“一路不通找别路”更有可能搜索最优值;如果数据集较小,可以采用全数据集(Full batch learning)的形式,这样有两个显然的好处:1.由全数据集计算的梯度能够更好的代表样本总体,从而更准确的朝向极值所在的方向;在深度学习中,一般采用SGD训练,即每次训练在训练集中取batchsize个样本训练;原创 2024-11-08 10:50:53 · 184 阅读 · 0 评论 -
DL-3利用MNIST搭建神经网络模型(三种方法):1.用CNN 2.用CNN+RNN 3.用自编码网络autoencoder
3个卷积层3个池化层1个全连接层和输出层的NN# 初始化权重,卷积核的大小为3x3w = init_weights([3,3,1,32]) # patch的大小为3x3,输入维度为1,输出维度为32w4 = init_weights([128*4*4,625]) # 全连接层,输入维度为128*4*4,是上一层输出数据由三维转换为一维,输出维度为625w_o = init_weights([625,10]) # 输出层维度为625,输出维度为10,代表10类labels。原创 2024-11-08 10:50:39 · 674 阅读 · 0 评论 -
DL-2如何打开TensorBoard(在Mac上)
这个是一开始的报错的文件的内容,当然一开始我并不知道,应该写一个将程序写入一个logs文件夹中,所以也就找不到logs文件,因此也就不可能执行成功。再次必须写一篇博客,一次来说明这打开tensorboard的艰难之路,遇到了好多错误,真的是走了好多弯路,最后还是解决了。一开始总是报错,不知道是为什么,其实还是自己没有看懂原理,就冲动的开始招呼画瓢,结果找错的痛苦也就是不可避免了。在终端下输入下面的命令:(此时logdir=后面的路径logs文件夹的上一层的路径)此时在logs文件夹下回生成一个事件文件。原创 2024-11-08 10:50:21 · 308 阅读 · 0 评论 -
DL-1 用一元二次方程 y=x^2+b 构建神经网络
dtype:数据类型。常用的是tf.float32,tf.float64等数值类型 shape:数据形状。默认是None,就是一维值,也可以是多维,比如[2,3], [None, 3]表示列是3,行不定 name:名称。此函数可以理解为形参,用于定义过程,在执行的时候再赋具体的值。# 之后补充损失函数的可视化。原创 2024-11-08 10:50:06 · 208 阅读 · 0 评论 -
CNN 模型的参数(parameters)数量和浮点运算数量(FLOPs)是怎么计算的
文章目录1 模型参数(parameters)的个数1.1 模型参数介绍1.2 常见网络的模型参数个数1.2 举例如何计算神经网络模型参数2 FLOPS:每秒浮点运算次数2.1 `FLOPS`定义2.2 FLOPS的常见单位2.3 FLOPS的计算方法3 FLOPs:浮点运算的次数3.1 `FLOPs`定义3.2 常见模型的FLOPs指标3.3 如何计算FLOPs3.4 FLOPs卷积的浮点计算次数4 TOPS4.1 TOPS定义4.2 TOPS和FLOPS的区别5 Pytorch的FLOPs的计算工具5.1原创 2024-11-08 10:48:53 · 1262 阅读 · 0 评论 -
8_用opencv调用深度学习框架tenorflow、Pytorch、Torch、caffe训练好的模型(20190212)
https://blog.youkuaiyun.com/hust_bochu_xuchao/article/details/79428759https://zhuanlan.zhihu.com/p/28703867http://www.itdaan.com/blog/2018/04/21/7eada84410cde8ce686ceb5538841e40.htmlhttps://www.cnblogs.com/messier/p/7997951.htmlhttps://my.oschina.net/wujux/blog原创 2024-11-08 10:47:57 · 425 阅读 · 0 评论 -
7_nvidia-smi命令在windows上打不开和nvidia-smi显示参数说明(20190130)
如果你已经在Windows系统中安装了NVIDIA的驱动,但是windows的命令行中输入。:是因为没有将NVIDIA的可执行程序添加到环境变量中。更多命令的详细使用信息,请用。,所以把该路径添加到。原创 2024-11-08 10:47:37 · 1713 阅读 · 0 评论 -
6_分布式训练框架Horovod使用(20190111)
Horovod名字的来源Horovod,它的名字来自于俄国传统民间舞蹈,舞者手牵手围成一个圈跳舞,与分布式 TensorFlow 流程使用 Horovod 互相通信的场景很像。Horovod发展史Horovod是Uber(优步)开源的又一个深度学习工,Horovod在2017年10月,Uber以Apache 2.0授权许可开源发布。Horovod是优步跨多台机器的分布式训练框架,现已加入开源计划LF Deep Learning Foundation。原创 2024-11-08 10:47:08 · 1076 阅读 · 0 评论 -
5_计算显卡对比(20190103- )
另外,为了支持高精度计算不会在读写存储时出现误差,Tesla通常都采用了带ECC纠错能力的HBM2显存,这种显存产量低价格昂贵,这也构成了Tesla计算卡价格昂贵的原因之一。上图是最近热门的Nvidia Volta核心SM单元结构图,可以看到一个SM单元不仅保留了FP32/FP16混合计算,还支持IN8与FP64甚至单独的Tensor,这样一张Volta完整核心的Tesla计算卡可以胜任半精度(AI/深度学习)、单精度(普通影音处理)和双精度(生化物理研究模拟等)甚至120T的Tensor多重计算任务。原创 2024-11-08 10:46:44 · 1212 阅读 · 0 评论 -
4_Tensorflow框架的使用(20181217-)
定义参数的类型(类似python中的argparse模块的使用):FLAGS = tf.flags.FLAGS 是定义调用参数的对象定义参数的类型和默认值 ,参数:参数名称,默认参数(无论什么类型,在定义的时候都先写成字符串的形式),参数解释说明tf.flags.DEFINE_string("logs_dir", "logs/", "path to logs directory") # 下面填写参数的时候是 FALGS.log_dir 即可。原创 2024-11-08 10:45:49 · 465 阅读 · 0 评论 -
3_深度学习中显卡的使用和显存的分配(20181213)
如果在TensorFlow代码库中搜索调用这段代码的宏TF_CALL_GPU_NUMBER_TYPES,可以发现在GPU上,tf.Variable操作只支持实数型(float16、float32和double)的参数。TensorFlow程序可以通过tf.device函数来指定运行每一个操作的设备,这个设备可以是本地的CPU或者GPU,也可以是某一台远程的服务器。但在本文中只关心本地的设备。而一台机器上不同GPU的名称是不同的,第n个GPU在TensorFlow中的名称为/gpu:n。原创 2024-11-08 10:45:27 · 1220 阅读 · 0 评论 -
2_初学者快速掌握主流深度学习框架Tensorflow、Keras、Pytorch学习代码(20181211)
本资源旨在通过示例轻松深入了解TensorFlow。为了便于阅读,它包括notebook和带注释的源代码。它适合想要找到关于TensorFlow的清晰简洁示例的初学者。除了传统的“原始”TensorFlow实现,您还可以找到最新的TensorFlow API实践(例如layers,estimator,dataset, …)。最后更新(07/25/2018):添加新示例(GBDT,Word2Vec)和 TF1.9兼容性!(TF v1.9 +推荐)。原创 2024-11-08 10:45:07 · 1144 阅读 · 0 评论