自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(82)
  • 资源 (6)
  • 收藏
  • 关注

原创 alexnet论文(2017)(经典分类网络)

的top-5错误率,这比之前的最佳结果有显著提升。该神经网络包含6000万个参数和65万个神经元,由五个卷积层(部分卷积层后接最大池化层)和三个全连接层组成,最终通过1000维的softmax进行分类。为了加速训练,我们采用了非饱和神经元和高效的GPU卷积运算实现。为减少全连接层的过拟合,我们使用了名为"dropout"的最新正则化方法,该方法被证明非常有效。我们还以该模型的变体参加了ILSVRC-2012竞赛,并以。的top-5测试错误率获胜,而第二名的成绩为。的top-1错误率和。

2025-09-23 11:51:54 931

原创 VGG论文(2015)(经典分类网络)

3×3本研究探讨了卷积网络深度在大规模图像识别任务中对准确率的影响。我们的主要贡献是采用极小3×3卷积核架构对不同深度网络进行了全面评估,结果表明当网络深度达到16-19个权重层时,能在现有最优配置基础上实现显著提升。这些发现构成了我们参加2014年ImageNet竞赛的基础方案,最终团队在定位和分类赛道分别斩获冠亚军。我们还证明该表征方法能有效迁移至其他数据集,并取得当前最优性能。为促进深度视觉表征在计算机视觉领域的进一步研究,我们已将两个最佳卷积网络模型开源发布。

2025-09-19 11:00:01 791

原创 基础分割模型U-Net

【代码】基础分割模型U-Net。

2025-09-16 15:20:38 180

原创 基础分类模型fashmnist

【代码】基础分类模型fashmnist。

2025-09-16 11:30:54 173

原创 LeetCode1 两数之和(C++)

题目链接给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 的那 两个 整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不能重复出现。你可以按任意顺序返回答案。示例 1:输入:nums = [2,7,11,15], target = 9输出:[0,1]解释:因为 nums[0] + nums[1] == 9 ,返回 [0, 1] 。示例 2:输入:nums = [3,2,4], target = 6输

2025-09-11 11:29:38 228

原创 LeetCode2 两数相加 两个链表相加(C++)

题目链接给你两个非空的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储一位数字。请你将两个数相加,并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外,这两个数都不会以 0 开头。示例 1:输入:l1 = [2,4,3], l2 = [5,6,4]输出:[7,0,8]解释:342 + 465 = 807.示例 2:输入:l1 = [0], l2 = [0]输出:[0]示例 3:输入:l1 = [9,9,9,9,9,9,9], l2

2025-09-11 11:27:54 336

原创 LeetCode3 无重复字符的最长字串长度(C++)

题目链接给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。示例 1:输入: s = "abcabcbb"输出: 3 解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。示例 2:输入: s = "bbbbb"输出: 1解释: 因为无重复字符的最长子串是 “b”,所以其长度为 1。示例 3:输入: s = "pwwkew"输出: 3解释: 因为无重复字符的最长子串是 “wke”,所以其长度为 3。请注意,你的答案必须是 子串 的长度,“pwke”

2025-09-11 11:27:30 220

原创 海思交叉编译器安装

1.准备文件先将交叉编译器文件arm-himix200-linux.tgz拷贝到linux(本例使用ubuntu18.04),移动到某个目录下。2.解压压缩包tar zxvf arm-himix200-linux.tgz3.安装当前目录解压出来一个文件夹arm-himix200-linux,进入之后看到readme.txt提示如何安装切换超级用户或者更改文件权限执行source ./arm-himix200-linux.install /opt/hisi-linux-x86-arm安装

2025-09-11 11:26:53 231

原创 avg_pool3d算子源码

【代码】avg_pool3d算子源码。

2025-09-11 11:25:18 76

原创 手动实现BatchNorm2D算子

【代码】手动实现BatchNorm2D算子。

2025-09-09 17:18:51 207

原创 MQBench记录

PTQ可以作为QAT初始化开启伪量化后,模型停止校准通过梯度更新学习scale、zp,或者固定scale调整weight将模型与量化参数以ONNX形式保存然后将量化参数从ONNX分离开。

2025-08-07 17:14:56 170

原创 Attention is All You Need(Transformer提出的论文)

本文提出了Transformer模型,这是一种完全基于注意力机制的新型神经网络架构,摒弃了传统的循环和卷积结构。

2025-06-26 18:17:32 544

原创 Learning Transferable Visual Models From Natural Language Supervision(CLIP论文)

clip论文

2025-06-06 18:13:28 557

原创 Towards Open World Object Detection概述(OWOD论文)

1人类天生具备识别环境中未知物体实例的本能。当相关知识最终可获得时,对这些未知实例的内在好奇心有助于人们认知它们。这促使我们提出一个名为"开放世界目标检测"的新型计算机视觉问题,该模型需要完成两项任务:1)在没有明确监督的情况下,将未接触过的物体识别为"未知";2)在逐步获得相应标签时,能够持续学习这些已识别的未知类别而不遗忘先前习得的类别。我们构建了问题框架,制定了严格的评估标准,并提出基于对比聚类和能量检测的未知识别新方法ORE(开放世界目标检测器)。

2025-06-04 18:29:12 1519

原创 OpenCLIP简介

CLIP数据集来自LAION-5B(LAION-400M,LAION-2B,DataComp-1B,DFN-5B?),由50亿个图片以及图片对应的标签组成。包含23.2亿的英文描述,22.6亿个100+其他语言以及12.7亿的未知语。CLIP(Contrastive Language-Image Pretraining), 是OpenAI利用4亿张互联网上找到的图片,以及图片对应的Alternative文字训练的多模态模型。

2025-06-03 11:27:29 717

原创 YOLO-UniOW概述(论文)

传统的目标检测模型受到闭集数据集的限制,仅检测训练过程中遇到的类别。虽然多模态模型通过对齐文本和图像模态扩展了类别识别,但由于跨模态融合,它们引入了显著的推理开销,并且仍然受到预定义词汇的限制,使得它们在处理开放世界场景中的未知对象时无效。在这项工作中,我们引入了通用开放世界对象检测(Uni-OWD),这是一种将开放词汇表和开放世界对象探测任务相结合的新范式。为了解决这种设置的挑战,我们提出了YOLO-UniOW,这是一种新的模型,可以提高效率、多功能性和性能的界限。

2025-05-28 18:20:07 1185

原创 convtranspose3d

【代码】convtranspose3d。

2025-04-07 02:54:07 272

原创 avg_pool3d算子

【代码】avg_pool3d算子。

2025-04-05 21:59:24 106

原创 conv3d算子

【代码】conv3d算子。

2025-04-05 21:57:36 111

原创 yolov8/yolov10 损失函数代码解析

yolov10损失函数代码分析

2024-08-29 17:06:05 680 1

原创 BCEWithLogitsLoss

BCEWithLogitsLoss 是 PyTorch 深度学习框架中的一个损失函数,用于二元分类问题。它结合了 Sigmoid 激活函数和二元交叉熵损失(Binary Cross Entropy Loss),使得在训练过程中更加数值稳定。

2024-08-21 14:49:23 2562

原创 目标检测 | yolov10 原理和介绍

在过去的几年里,YOLO 已成为实时目标检测领域的主要范式,因为它们在计算成本和检测性能之间有效平衡。研究人员探索了 YOLO 的架构设计、优化目标、数据增强策略等,取得了显着进展。然而,对非最大抑制(NMS)进行后处理的依赖阻碍了YOLO的端到端部署,并对推理延迟产生不利影响。此外,YOLOs中各个组件的设计缺乏全面和彻底的检测,导致计算冗余明显,限制了模型的能力。它使次优效率,以及性能改进的巨大潜力。在这项工作中,我们的目标是从后处理和模型架构中进一步推进 YOLO 的性能效率边界。

2024-08-20 19:59:49 6407

原创 目标检测 | yolov9 原理和介绍

今天的深度学习方法侧重于如何设计最合适的目标函数,以便模型的预测结果可以最接近基本事实。同时,必须设计能够促进获取足够信息进行预测的适当架构。现有方法忽略了输入数据经过逐层特征提取和空间变换时的事实,会丢失大量信息。当数据通过深度网络传输时,本文将深入研究数据丢失的重要问题,即信息瓶颈和可逆函数。我们提出了可编程梯度信息 (PGI) 的概念来应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息来更新网络权重。

2024-08-20 14:58:38 3142 1

原创 目标检测 | yolov8 原理和介绍

近年来,You Only Look Once (YOLO)系列目标检测算法因其在实时应用中的速度和准确性而受到广泛关注。本文提出了一种新的目标检测算法YOLOv8,它建立在以前迭代的基础上,旨在进一步提高性能和鲁棒性。受到从YOLOv1到YOLOv7的YOLO架构演变的启发,以及从YOLOv5和YOLOv6等模型的比较分析中获得的见解,YOLOv8结合了关键创新,以实现最佳的速度和准确性。利用注意力机制和动态卷积,YOLOv8引入了专门为小物体检测量身定制的改进,解决了YOLOv7中突出的挑战。

2024-08-19 11:59:02 3511 1

原创 目标检测 | yolov7 原理和介绍

YOLOv7是目标检测领域中YOLO系列的最新进展,它在速度和准确性上都取得了显著的提升,被认为是目标检测领域的新里程碑。模型重参数化:YOLOv7首次将模型重参数化技术引入网络架构中,这一技术最早在REPVGG中提出,有助于提升模型表达能力而不增加计算复杂度。标签分配策略:YOLOv7采用了结合YOLOv5和YOLOX优点的标签分配策略,通过跨网格搜索和匹配策略,提高了检测准确性。

2024-08-16 18:16:28 5712

原创 目标检测 | yolov6 原理和介绍

YOLOv6是由美团视觉智能部研发的一款目标检测框架,专注于工业应用,致力于提供极致的检测精度和推理效率。相较于YOLOv4和YOLOv5,YOLOv6在网络结构方面进行了深入优化,提升了模型的检测精度,并在处理复杂场景时更加稳健。同时,YOLOv6还在保持高效性的基础上,减少了模型的参数量,适合在移动端等计算资源有限的设备上运行。YOLOv6的改进包括采用轻量级的卷积模块和引入注意力机制,更好地捕捉图像中的关键信息。它还针对小目标检测问题进行了优化,改进了锚框的生成方式,适应不同尺寸的目标。

2024-08-15 20:44:29 2988 1

原创 目标检测 | yolov5 原理和介绍

YOLOv5是YOLO系列中一个重要的版本,它在目标检测领域具有显著的性能提升和改进。Mosaic数据增强:YOLOv5在训练阶段采用了Mosaic数据增强技术,这种技术通过将四张图片随机缩放、裁剪并拼接成一张图片,增加了模型训练时的多样性,有助于提升模型对小目标的检测能力。自适应锚框计算:YOLOv5引入了自适应锚框计算方法,该方法使用K-means聚类对训练集中的边界框进行分析,并自动调整锚框的大小和比例,以适应不同数据集的特点。

2024-08-07 18:21:55 1241

原创 目标检测 | yolov4 原理和介绍

YOLOv4是一种高效且准确的目标检测模型,它在YOLOv3的基础上引入了多项改进,这些改进主要集中在网络结构的优化和训练技巧的更新上。论文链接:https://arxiv.org/abs/2004.10934时间:2020年作者:Alexey Bochkovskiy代码参考:https://github.com/Tianxiaomo/pytorch-YOLOv4大量的特征据说可以提高卷积神经网络(CNN)的精度。需要在大数据集上对这些特征的组合进行实际测试,并对结果进行理论证明。

2024-08-06 16:18:03 2728

原创 目标检测 | yolov3 原理和介绍

YOLOv3 擅于预测出合适的目标,但无法预测出非常精准的边界框。YOLOv3 小目标预测能力提升,但中大目标的预测反而相对较差。若将速度考量进来,YOLOv3 整体来说表现非常出色。YOLOv3在小目标\密集目标的改进1.grid cell个数增加,YOLOv1(7×7),YOLOv2(13×13),YOLOv3(13×13+26×26+52×52)2.YOLOv2和YOLOv3可以输入任意大小的图片,输入图片越大,产生的grid cell越多,产生的预测框也就越多。

2024-08-05 18:41:17 4265 1

原创 目标检测 | yolov2/yolo9000 原理和介绍

论文链接:https://arxiv.org/abs/1612.08242时间:2016年作者:Joseph Redmon作者首先在YOLOv1的基础上提出了改进的YOLOv2,然后提出了一种检测与分类联合训练方法,使用这种联合训练方法在COCO检测数据集和ImageNet分类数据集上训练出了YOLO9000模型,其可以检测超过9000多类物体。所以,这篇文章其实包含两个模型:YOLOv2和YOLO9000,不过后者是在前者基础上提出的,两者模型主体结构是一致的。

2024-08-01 19:05:30 1514

原创 目标检测 | yolov1 原理和介绍

论文链接:https://arxiv.org/abs/1506.02640时间:2015年作者:Joseph Redmon代码参考:https://github.com/abeardear/pytorch-YOLO-v1。

2024-08-01 17:11:39 1735

原创 vscode离线安装ssh插件(本机和服务器都离线)

点击复制(因为我写博客和自己实际用的离线机器不同,所以截图中的ID有差别,以实际ID为准,图片只做示范参考)假设远程ssh服务器是linux64位的,利用这个ID下载server-linux-x64压缩包。把下载好的vscode-server-linux-x64.tar.gz文件放在远程ssh服务器上。.........

2022-08-10 12:01:07 3343

原创 ubuntu下使用ftp

get b.txt:下载ftp服务器当前的目录下的文件b.txt到本地主机的当前进入的目录XX。put a.txt: 上传本地文件a.txt到ftp服务器。修改ftp的配置文件 /etc/vsftpd.conf。cd XXX: 进入服务器文件夹目录 ~/XXX。lcd XX:进入本地文件夹目录 ~/XX。...

2022-08-04 14:41:43 3790

原创 pip源设置并批量下载包

修改 ~/.pip/pip.conf (没有就创建一个pip文件夹及pip.conf 文件。requirements.txt中例如。

2022-08-04 14:25:50 488

原创 anaconda安装和使用

ubuntu: bash Anaconda3-2021.11-Linux-x86_64.sh 也是记着安装目录。windows:exe安装,设置安装目录,记着就好,其他的可以默认设置。命令行创建一个虚拟的环境,并指定python版本。成功后在用户目录有个.condarc文件。...

2022-08-04 14:23:58 258

原创 海思Hi3519AV100 emmc flash方式 linux系统移植 hitool工具烧写

hi3519av100 emmc模式 linux系统烧录启动

2022-04-18 20:10:03 4118 1

原创 海思芯片介绍

海思芯片介绍

2022-01-18 19:20:10 6089 4

原创 ubuntu18.04编译使用 caffe cpu 使用工具示例 训练示例

ubuntu18.04安装cpu版本的caffe使用caffe生成网络神经图

2021-12-02 19:36:47 1263 2

原创 docker安装和使用

安装docker1.卸载旧版本sudo apt-get remove docker docker-engine docker.io containerd runc2.更新 apt 包索引sudo apt-get update3.安装 apt 依赖包sudo apt-get install apt-transport-https ca-certificates curl gnupg-agent software-properties-common4.添加 Docker 的官方 GPG 密钥

2021-12-02 11:37:17 1061

原创 anaconda安装记录

下载安装anaconda 官网:ananconda.com Anaconda3-2021.05-Linux-x86_64.sh安装 bash Anaconda3-2021.05-Linux-x86_64.sh

2021-10-24 21:09:33 520

TSToES工具(ts文件提取音频视频es、ps,去DTS_PTS)

简单小巧的ts文件提取音频视频es文件,提取ps流,改变scr,去dtspts。生成es文件可以只提取视频或音频也可以一起提取。适合学习ts流解码编码

2020-09-28

数字电视业务信息及其编码.pdf

数字电视业务信息及其编码。详细讲了MPEG标准以及解析,配合MPEG-2标准.pdf可以更加详细的了解MPEG标准。里面详细讲了ts中各名词含义,解析方式和标准以及各参数含义。IBP帧、信息表、时码、网络、业务在ts包中的体现。

2020-09-28

apk_sign.zip

Android开发中对apk签名所需的依赖包文件及签名命令,此资源不需要安装额外的工具,在电脑有java的基础上使用cmd命令(Windows系统)或cd(Linux系统)进入指定的目录输入一条命令即可对执行的apk文件进行系统级的签名。

2020-03-03

三种最大公约数算法耗时比较(vs2008使用MFC程序测试)demo

三种最大公约数算法耗时比较(vs2008使用MFC程序测试)demo

2021-01-15

MPEG2_CHS(中文).pdf

国际MPEG-2标准协议详解中文版(建议配合数字电子业务技术理解其中的标准以及动手写代码亲自实现)。ITU-TRec. H.262 |ISO/IEC 13818-2和ISO/IEC 13818-3标准对视频和音频信号进行编码压缩后的原始流被组合形成PES分组。当PES分组形成的时候,使用该分组所需的与传送流及程序流无关的信息是可被加入的。

2020-09-28

json_all-master.zip

java实现json解析和json对象所用到的第三方库。将此文件中6个jar文件导入Eclipse项目中libs文件夹(或者新建)中。 在Eclipse项目文件夹下的libs文件中,右键这些jar文件选择Build Path然后选择Add to Build Path即可

2019-11-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除