- 博客(82)
- 资源 (6)
- 收藏
- 关注
原创 alexnet论文(2017)(经典分类网络)
的top-5错误率,这比之前的最佳结果有显著提升。该神经网络包含6000万个参数和65万个神经元,由五个卷积层(部分卷积层后接最大池化层)和三个全连接层组成,最终通过1000维的softmax进行分类。为了加速训练,我们采用了非饱和神经元和高效的GPU卷积运算实现。为减少全连接层的过拟合,我们使用了名为"dropout"的最新正则化方法,该方法被证明非常有效。我们还以该模型的变体参加了ILSVRC-2012竞赛,并以。的top-5测试错误率获胜,而第二名的成绩为。的top-1错误率和。
2025-09-23 11:51:54
931
原创 VGG论文(2015)(经典分类网络)
3×3本研究探讨了卷积网络深度在大规模图像识别任务中对准确率的影响。我们的主要贡献是采用极小3×3卷积核架构对不同深度网络进行了全面评估,结果表明当网络深度达到16-19个权重层时,能在现有最优配置基础上实现显著提升。这些发现构成了我们参加2014年ImageNet竞赛的基础方案,最终团队在定位和分类赛道分别斩获冠亚军。我们还证明该表征方法能有效迁移至其他数据集,并取得当前最优性能。为促进深度视觉表征在计算机视觉领域的进一步研究,我们已将两个最佳卷积网络模型开源发布。
2025-09-19 11:00:01
791
原创 LeetCode1 两数之和(C++)
题目链接给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 的那 两个 整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不能重复出现。你可以按任意顺序返回答案。示例 1:输入:nums = [2,7,11,15], target = 9输出:[0,1]解释:因为 nums[0] + nums[1] == 9 ,返回 [0, 1] 。示例 2:输入:nums = [3,2,4], target = 6输
2025-09-11 11:29:38
228
原创 LeetCode2 两数相加 两个链表相加(C++)
题目链接给你两个非空的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储一位数字。请你将两个数相加,并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外,这两个数都不会以 0 开头。示例 1:输入:l1 = [2,4,3], l2 = [5,6,4]输出:[7,0,8]解释:342 + 465 = 807.示例 2:输入:l1 = [0], l2 = [0]输出:[0]示例 3:输入:l1 = [9,9,9,9,9,9,9], l2
2025-09-11 11:27:54
336
原创 LeetCode3 无重复字符的最长字串长度(C++)
题目链接给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。示例 1:输入: s = "abcabcbb"输出: 3 解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。示例 2:输入: s = "bbbbb"输出: 1解释: 因为无重复字符的最长子串是 “b”,所以其长度为 1。示例 3:输入: s = "pwwkew"输出: 3解释: 因为无重复字符的最长子串是 “wke”,所以其长度为 3。请注意,你的答案必须是 子串 的长度,“pwke”
2025-09-11 11:27:30
220
原创 海思交叉编译器安装
1.准备文件先将交叉编译器文件arm-himix200-linux.tgz拷贝到linux(本例使用ubuntu18.04),移动到某个目录下。2.解压压缩包tar zxvf arm-himix200-linux.tgz3.安装当前目录解压出来一个文件夹arm-himix200-linux,进入之后看到readme.txt提示如何安装切换超级用户或者更改文件权限执行source ./arm-himix200-linux.install /opt/hisi-linux-x86-arm安装
2025-09-11 11:26:53
231
原创 MQBench记录
PTQ可以作为QAT初始化开启伪量化后,模型停止校准通过梯度更新学习scale、zp,或者固定scale调整weight将模型与量化参数以ONNX形式保存然后将量化参数从ONNX分离开。
2025-08-07 17:14:56
170
原创 Attention is All You Need(Transformer提出的论文)
本文提出了Transformer模型,这是一种完全基于注意力机制的新型神经网络架构,摒弃了传统的循环和卷积结构。
2025-06-26 18:17:32
544
原创 Learning Transferable Visual Models From Natural Language Supervision(CLIP论文)
clip论文
2025-06-06 18:13:28
557
原创 Towards Open World Object Detection概述(OWOD论文)
1人类天生具备识别环境中未知物体实例的本能。当相关知识最终可获得时,对这些未知实例的内在好奇心有助于人们认知它们。这促使我们提出一个名为"开放世界目标检测"的新型计算机视觉问题,该模型需要完成两项任务:1)在没有明确监督的情况下,将未接触过的物体识别为"未知";2)在逐步获得相应标签时,能够持续学习这些已识别的未知类别而不遗忘先前习得的类别。我们构建了问题框架,制定了严格的评估标准,并提出基于对比聚类和能量检测的未知识别新方法ORE(开放世界目标检测器)。
2025-06-04 18:29:12
1519
原创 OpenCLIP简介
CLIP数据集来自LAION-5B(LAION-400M,LAION-2B,DataComp-1B,DFN-5B?),由50亿个图片以及图片对应的标签组成。包含23.2亿的英文描述,22.6亿个100+其他语言以及12.7亿的未知语。CLIP(Contrastive Language-Image Pretraining), 是OpenAI利用4亿张互联网上找到的图片,以及图片对应的Alternative文字训练的多模态模型。
2025-06-03 11:27:29
717
原创 YOLO-UniOW概述(论文)
传统的目标检测模型受到闭集数据集的限制,仅检测训练过程中遇到的类别。虽然多模态模型通过对齐文本和图像模态扩展了类别识别,但由于跨模态融合,它们引入了显著的推理开销,并且仍然受到预定义词汇的限制,使得它们在处理开放世界场景中的未知对象时无效。在这项工作中,我们引入了通用开放世界对象检测(Uni-OWD),这是一种将开放词汇表和开放世界对象探测任务相结合的新范式。为了解决这种设置的挑战,我们提出了YOLO-UniOW,这是一种新的模型,可以提高效率、多功能性和性能的界限。
2025-05-28 18:20:07
1185
原创 BCEWithLogitsLoss
BCEWithLogitsLoss 是 PyTorch 深度学习框架中的一个损失函数,用于二元分类问题。它结合了 Sigmoid 激活函数和二元交叉熵损失(Binary Cross Entropy Loss),使得在训练过程中更加数值稳定。
2024-08-21 14:49:23
2562
原创 目标检测 | yolov10 原理和介绍
在过去的几年里,YOLO 已成为实时目标检测领域的主要范式,因为它们在计算成本和检测性能之间有效平衡。研究人员探索了 YOLO 的架构设计、优化目标、数据增强策略等,取得了显着进展。然而,对非最大抑制(NMS)进行后处理的依赖阻碍了YOLO的端到端部署,并对推理延迟产生不利影响。此外,YOLOs中各个组件的设计缺乏全面和彻底的检测,导致计算冗余明显,限制了模型的能力。它使次优效率,以及性能改进的巨大潜力。在这项工作中,我们的目标是从后处理和模型架构中进一步推进 YOLO 的性能效率边界。
2024-08-20 19:59:49
6407
原创 目标检测 | yolov9 原理和介绍
今天的深度学习方法侧重于如何设计最合适的目标函数,以便模型的预测结果可以最接近基本事实。同时,必须设计能够促进获取足够信息进行预测的适当架构。现有方法忽略了输入数据经过逐层特征提取和空间变换时的事实,会丢失大量信息。当数据通过深度网络传输时,本文将深入研究数据丢失的重要问题,即信息瓶颈和可逆函数。我们提出了可编程梯度信息 (PGI) 的概念来应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息来更新网络权重。
2024-08-20 14:58:38
3142
1
原创 目标检测 | yolov8 原理和介绍
近年来,You Only Look Once (YOLO)系列目标检测算法因其在实时应用中的速度和准确性而受到广泛关注。本文提出了一种新的目标检测算法YOLOv8,它建立在以前迭代的基础上,旨在进一步提高性能和鲁棒性。受到从YOLOv1到YOLOv7的YOLO架构演变的启发,以及从YOLOv5和YOLOv6等模型的比较分析中获得的见解,YOLOv8结合了关键创新,以实现最佳的速度和准确性。利用注意力机制和动态卷积,YOLOv8引入了专门为小物体检测量身定制的改进,解决了YOLOv7中突出的挑战。
2024-08-19 11:59:02
3511
1
原创 目标检测 | yolov7 原理和介绍
YOLOv7是目标检测领域中YOLO系列的最新进展,它在速度和准确性上都取得了显著的提升,被认为是目标检测领域的新里程碑。模型重参数化:YOLOv7首次将模型重参数化技术引入网络架构中,这一技术最早在REPVGG中提出,有助于提升模型表达能力而不增加计算复杂度。标签分配策略:YOLOv7采用了结合YOLOv5和YOLOX优点的标签分配策略,通过跨网格搜索和匹配策略,提高了检测准确性。
2024-08-16 18:16:28
5712
原创 目标检测 | yolov6 原理和介绍
YOLOv6是由美团视觉智能部研发的一款目标检测框架,专注于工业应用,致力于提供极致的检测精度和推理效率。相较于YOLOv4和YOLOv5,YOLOv6在网络结构方面进行了深入优化,提升了模型的检测精度,并在处理复杂场景时更加稳健。同时,YOLOv6还在保持高效性的基础上,减少了模型的参数量,适合在移动端等计算资源有限的设备上运行。YOLOv6的改进包括采用轻量级的卷积模块和引入注意力机制,更好地捕捉图像中的关键信息。它还针对小目标检测问题进行了优化,改进了锚框的生成方式,适应不同尺寸的目标。
2024-08-15 20:44:29
2988
1
原创 目标检测 | yolov5 原理和介绍
YOLOv5是YOLO系列中一个重要的版本,它在目标检测领域具有显著的性能提升和改进。Mosaic数据增强:YOLOv5在训练阶段采用了Mosaic数据增强技术,这种技术通过将四张图片随机缩放、裁剪并拼接成一张图片,增加了模型训练时的多样性,有助于提升模型对小目标的检测能力。自适应锚框计算:YOLOv5引入了自适应锚框计算方法,该方法使用K-means聚类对训练集中的边界框进行分析,并自动调整锚框的大小和比例,以适应不同数据集的特点。
2024-08-07 18:21:55
1241
原创 目标检测 | yolov4 原理和介绍
YOLOv4是一种高效且准确的目标检测模型,它在YOLOv3的基础上引入了多项改进,这些改进主要集中在网络结构的优化和训练技巧的更新上。论文链接:https://arxiv.org/abs/2004.10934时间:2020年作者:Alexey Bochkovskiy代码参考:https://github.com/Tianxiaomo/pytorch-YOLOv4大量的特征据说可以提高卷积神经网络(CNN)的精度。需要在大数据集上对这些特征的组合进行实际测试,并对结果进行理论证明。
2024-08-06 16:18:03
2728
原创 目标检测 | yolov3 原理和介绍
YOLOv3 擅于预测出合适的目标,但无法预测出非常精准的边界框。YOLOv3 小目标预测能力提升,但中大目标的预测反而相对较差。若将速度考量进来,YOLOv3 整体来说表现非常出色。YOLOv3在小目标\密集目标的改进1.grid cell个数增加,YOLOv1(7×7),YOLOv2(13×13),YOLOv3(13×13+26×26+52×52)2.YOLOv2和YOLOv3可以输入任意大小的图片,输入图片越大,产生的grid cell越多,产生的预测框也就越多。
2024-08-05 18:41:17
4265
1
原创 目标检测 | yolov2/yolo9000 原理和介绍
论文链接:https://arxiv.org/abs/1612.08242时间:2016年作者:Joseph Redmon作者首先在YOLOv1的基础上提出了改进的YOLOv2,然后提出了一种检测与分类联合训练方法,使用这种联合训练方法在COCO检测数据集和ImageNet分类数据集上训练出了YOLO9000模型,其可以检测超过9000多类物体。所以,这篇文章其实包含两个模型:YOLOv2和YOLO9000,不过后者是在前者基础上提出的,两者模型主体结构是一致的。
2024-08-01 19:05:30
1514
原创 目标检测 | yolov1 原理和介绍
论文链接:https://arxiv.org/abs/1506.02640时间:2015年作者:Joseph Redmon代码参考:https://github.com/abeardear/pytorch-YOLO-v1。
2024-08-01 17:11:39
1735
原创 vscode离线安装ssh插件(本机和服务器都离线)
点击复制(因为我写博客和自己实际用的离线机器不同,所以截图中的ID有差别,以实际ID为准,图片只做示范参考)假设远程ssh服务器是linux64位的,利用这个ID下载server-linux-x64压缩包。把下载好的vscode-server-linux-x64.tar.gz文件放在远程ssh服务器上。.........
2022-08-10 12:01:07
3343
原创 ubuntu下使用ftp
get b.txt:下载ftp服务器当前的目录下的文件b.txt到本地主机的当前进入的目录XX。put a.txt: 上传本地文件a.txt到ftp服务器。修改ftp的配置文件 /etc/vsftpd.conf。cd XXX: 进入服务器文件夹目录 ~/XXX。lcd XX:进入本地文件夹目录 ~/XX。...
2022-08-04 14:41:43
3790
原创 pip源设置并批量下载包
修改 ~/.pip/pip.conf (没有就创建一个pip文件夹及pip.conf 文件。requirements.txt中例如。
2022-08-04 14:25:50
488
原创 anaconda安装和使用
ubuntu: bash Anaconda3-2021.11-Linux-x86_64.sh 也是记着安装目录。windows:exe安装,设置安装目录,记着就好,其他的可以默认设置。命令行创建一个虚拟的环境,并指定python版本。成功后在用户目录有个.condarc文件。...
2022-08-04 14:23:58
258
原创 海思Hi3519AV100 emmc flash方式 linux系统移植 hitool工具烧写
hi3519av100 emmc模式 linux系统烧录启动
2022-04-18 20:10:03
4118
1
原创 ubuntu18.04编译使用 caffe cpu 使用工具示例 训练示例
ubuntu18.04安装cpu版本的caffe使用caffe生成网络神经图
2021-12-02 19:36:47
1263
2
原创 docker安装和使用
安装docker1.卸载旧版本sudo apt-get remove docker docker-engine docker.io containerd runc2.更新 apt 包索引sudo apt-get update3.安装 apt 依赖包sudo apt-get install apt-transport-https ca-certificates curl gnupg-agent software-properties-common4.添加 Docker 的官方 GPG 密钥
2021-12-02 11:37:17
1061
原创 anaconda安装记录
下载安装anaconda 官网:ananconda.com Anaconda3-2021.05-Linux-x86_64.sh安装 bash Anaconda3-2021.05-Linux-x86_64.sh
2021-10-24 21:09:33
520
TSToES工具(ts文件提取音频视频es、ps,去DTS_PTS)
2020-09-28
数字电视业务信息及其编码.pdf
2020-09-28
apk_sign.zip
2020-03-03
MPEG2_CHS(中文).pdf
2020-09-28
json_all-master.zip
2019-11-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅