
计算机视觉
文章平均质量分 96
是Dream呀
全网粉丝10w+,优快云、稀土掘金人工智能签约作者、专家博主,华为云十佳博主,985人工智能硕士。一万次悲伤依然会有Dream,我一直在最温暖的地方等你!
精通撰文推广有任何需求我都可以帮助到您— —学习交流|商务合作|粉丝福利:https://bbs.youkuaiyun.com/topics/614347534
展开
-
轻量图像超分辨率残差网络:Attention与ResNet融合
本文提出了一种名为RNET(Residual Network with Efficient Transformer)的网络,该网络结合了三种有效的设计元素:1. 使用蓝图可分离卷积代替传统卷积,减少计算负担。2. 提出局部特征提取的残差连接结构,简化特征聚合,加速推理。3. 将空间注意和通道注意机制被整合到我们的模型中。注意力机制通过让模型关注图像关键区域提升了识别精度,而轻量级残差网络通过减少参数和计算量,实现了在低资源消耗下的优秀性能。结合注意力机制与轻量级残差网络。原创 2025-04-01 20:15:47 · 762 阅读 · 11 评论 -
提高人类活动识别准确性的新方法:空间注意力与遗传算法的结合
人类活动识别(Human Activity Recognition, HAR)是环境计算和情境感知计算领域中一个重要的研究主题。随着智能手机和可穿戴设备的普及,HAR在诸如智能监控系统、健康护理、异常行为检测以及人机交互等多个领域变得越来越重要。HAR的目标是通过分析从各种传感器获得的数据来识别个体正在进行的活动。在HAR中,有两种主要的方法来从传感器数据中识别活动:基于视觉的方法和基于可穿戴传感器的方法。原创 2025-03-28 12:50:27 · 881 阅读 · 0 评论 -
基于异构卷积神经网络的传感器人体活动识别方法
本文提出的异构卷积网络通过双路径特征交互机制,有效提升了传感器时域信号的表征能力,为活动识别任务带来了新的思路。通过在特定卷积层中异构地利用卷积滤波器,并引入下采样操作调整感受野,使一组滤波器校准另一组普通滤波器,有效提升了模型性能。实验结果表明,异构卷积在各种HAR应用领域表现出色,无需调整网络。原创 2025-03-24 08:29:07 · 6079 阅读 · 29 评论 -
DL学习笔记:穿戴设备上的轻量级人体活动识别方法
论文的创新不仅在于技术突破,更在于重新定义了 HAR 的设计理念:效率优先:在保证准确率的前提下,优先考虑计算和内存效率。毕竟,可穿戴设备的用户更关心续航和响应速度。单传感器的哲学:少即是多。通过优化算法,减少对硬件的依赖,这对普及低成本可穿戴设备至关重要。它没有盲目追求更高的准确率,而是在效率和性能之间找到了黄金平衡点。用简单的统计方法替代复杂模型,用剪枝量化让 CNN “瘦身”,这些看似 “妥协” 的选择,实则是对可穿戴设备特性的深刻理解。原创 2025-03-22 15:44:54 · 5985 阅读 · 12 评论 -
CIR-DFENet:结合跨模态图像表示和双流特征增强网络进行活动识别
为了克服单一特征表示的局限性,提出了一种跨模态图像表示方法,将时间序列通过三种不同的编码方式(MTF、RP、GAF)分别转换为RGB三通道的彩色图像:R通道(MTF):捕捉时间序列的幅值变化特征。MTF基于马尔可夫转移矩阵,能够反映数据的全局变化趋势。G通道(RP):提取时间序列的非线性动态特征。RP通过相空间重构,能够捕捉数据的非线性关系。B通道(GAF):保留时间序列的局部时间关系。GAF将时间序列转换为极坐标,通过角度信息反映局部时间依赖性。原创 2025-03-15 12:27:25 · 6333 阅读 · 16 评论 -
基于置信度的自上而下的多人姿态估计与跟踪方法
由于近年来目标检测器的进步,自上而下的流程已经取得了巨大进步,并已成为主流。然而,遮挡和快速运动是阻碍这些方法完美的两个障碍。自上而下的方法根据由姿态估计器预测的热图过滤关键点,这些估计器针对图像而非视频帧进行优化。估计器受到运动模糊的影响,因此很难产生准确的关节点。此外,相邻人员之间的遮挡可能会误导估计器做出错误的预测。在本文中,通过一种新颖的置信度估计和时间校正策略来解决这两个问题。具体来说,实验设计了一个置信度网络来测量关键点的可见性,以及热图中的位置概率。然后,实验构建了一个姿态跟踪流程。原创 2025-03-10 23:05:12 · 12306 阅读 · 10 评论 -
ResNeXt: 通过聚合残差变换增强深度神经网络
基数作为新维度:首次将基数与深度、宽度并列,为网络设计提供新方向。模块化与可扩展性:所有残差块共享相同拓扑,避免了Inception的定制化复杂性。高效实现:通过分组卷积实现多路径聚合,兼顾性能与效率。在COCO目标检测任务中:Faster R-CNN框架下,ResNeXt-50较ResNet-50绝对提升2.1% AP@0.5后续工作(如Mask R-CNN)验证了本架构在实例分割任务的优越性。原创 2025-03-07 10:17:46 · 15733 阅读 · 15 评论 -
TCN-Inception:基于时序卷积网络和Inception模块的传感器人体活动识别方法
人体活动识别(HAR)作为人机交互、智能医疗和物联网应用的核心技术,面临传统方法对时序特征捕获不足的挑战。现有深度学习方法(如CNN和LSTM)在长期依赖性和计算效率方面存在局限,我们提出了一种融合时序卷积网络(TCN)与Inception模块的新型架构TCN-Inception。该模型通过多尺度特征提取和膨胀卷积机制,显著提升了传感器时序数据的建模能力。原创 2025-03-05 12:43:31 · 19760 阅读 · 12 评论 -
强化学习与多任务学习在高级人体活动识别中的融合应用
USC-HAD 数据集是一个广泛用于人类活动识别(HAR)研究的多模态数据集。该数据集定义了 12 种基本日常活动,每种活动由 14 名受试者进行 5 次重复试验,每次试验持续约 24 秒。试验中,受试者的腰部佩戴了一种高精度的 MotionNode 传感器,该传感器集成了三轴加速度计和三轴陀螺仪,能够以 100Hz 的采样频率捕捉人体的运动数据。这种高频率的采样对于捕捉细微的运动变化至关重要,有助于提高活动识别的准确性。原创 2025-02-17 10:59:08 · 36476 阅读 · 0 评论 -
Swin Transformer:深度解析其架构与代码实现
Swin Transformer通过扩展原始Transformer模型的能力,引入了层次化结构和基于窗口偏移的自注意力机制,使其能够有效处理图像数据,并可应用于图像分类、目标检测和分割等任务。Swin Transformer,由微软亚洲研究院孕育的新星,今年在学术界大放异彩,以其独特的魅力在图像分类、图像分割和目标检测等众多领域中斩获了无数荣誉。然而,Swin Transformer的诞生并非一帆风顺。原创 2025-01-27 14:06:11 · 50767 阅读 · 10 评论 -
基于Resnet、LSTM、Shufflenet及CNN网络的Daily_and_Sports_Activities数据集仿真
Daily_and_Sports_Activities数据集包含了19类日常活动和体育活动的图像,旨在训练和测试深度学习模型对不同活动类型的识别能力。每种网络结构都有其特定的优势和适用场景,CNN 提供了一种强大的特征提取方法,适用于图像识别等领域。ResNet 通过残差连接解决了深层网络的训练难题。LSTM 以其门控机制在序列数据处理方面表现出色。ShuffleNet 则是一种为移动和嵌入式设备设计的轻量级网络。原创 2024-12-29 10:12:58 · 23116 阅读 · 0 评论 -
Daily_and_Sports_Activities数据集的详细介绍及训练
该数据集包括19项日常和体育活动的运动传感器数据,每项活动由8名受试者以自己的风格进行5分钟。躯干、手臂和腿部使用五个Xsens-MTx单位。19 项活动中的每一项都由 8 名受试者(4 名女性,4 名男性,年龄在 20 至 30 岁之间)进行,每次 5 分钟。每个受试者的每项活动的总信号持续时间为 5 分钟。受试者被要求以自己的风格进行活动,并且不受活动方式的限制。出于这个原因,某些活动的速度和幅度存在主体间差异。这些活动在比尔肯特大学体育馆的电气和电子工程大楼进行, 在校园内平坦的户外区域。原创 2024-12-09 17:13:09 · 40804 阅读 · 8 评论 -
Spatial Attention Neural Network空间注意力网络介绍
这里定义了一个名为的类,它继承自nn.Module,是PyTorch中所有网络模块的基类。在初始化函数中,我们创建了一个序列模型,它包含一个卷积层和一个Sigmoid激活函数。卷积层的作用是提取空间特征,而Sigmoid函数将卷积层的输出转换为0到1之间的权重,这些权重将用于对输入特征图进行加权。类同样继承自nn.Module。表示训练数据的形状,category表示类别的数量。空间注意力网络的核心优势在于其能够自适应地识别并强化输入数据中的关键信息。原创 2024-11-30 10:59:19 · 43743 阅读 · 18 评论 -
生成对抗网络模拟缺失数据,辅助PAMAP2数据集仿真实验
PAMAP2(Physical Activity Monitoring 2)数据集是一个全面的身体活动监测数据集,记录了18种不同身体活动,如步行、骑车、踢足球等。这些活动数据由9名受试者在进行活动时佩戴的多个传感器收集得到。此数据集是活动识别、强度估计以及相关算法开发和应用研究的宝贵资源。dataset_dir: 数据集目录WINDOW_SIZE: 滑窗大小OVERLAP_RATE: 滑窗重叠率SPLIT_RATE: 训练集与验证集的比例。原创 2024-11-25 21:39:36 · 23695 阅读 · 33 评论 -
空间注意力网络的性能优化与多维评估
一个包含日常和体育活动数据的数据集。WISDM- 一个包含智能设备监测数据的数据集。UCI-HAR- 一个广泛使用的活动识别数据集,由加速度计数据组成。PAMAP2- 一个包含多种活动和生理信号的数据集。- 一个包含老年人日常活动数据的数据集。对于Daily_and_Sports_Activities等数据集,我们采用了随机裁剪、旋转和翻转等数据增强技术来增加模型对不同场景的适应性。这些技术不仅提高了模型的鲁棒性,还有助于减少过拟合的风险。原创 2024-11-26 13:03:20 · 45797 阅读 · 0 评论 -
残差网络ResNet的深入介绍和实战
ResNet是由Kaiming He等人在2015年提出的深度学习模型,它通过引入残差学习解决了随着网络深度增加而性能下降的问题。ResNet在多个视觉识别任务上取得了显著的成功,在ImageNet的分类比赛上将网络深度直接提高到了152层,前一年夺冠的VGG只有19层。斩获当年ImageNet竞赛中分类任务第一名,目标检测第一名。获得COCO数据集中目标检测第一名,图像分割第一名,可以说ResNet的出现对深度神经网络来说具有重大的历史意义。原创 2024-10-29 21:21:50 · 16484 阅读 · 0 评论 -
ShuffleNet通道混合轻量级网络的深入介绍和实战
ShuffleNet是一种轻量级的深度学习模型,它在保持MobileNet的Depthwise Separable Convolution(深度可分离卷积)的基础上,引入了通道混合(Channel Shuffle)机制,以进一步提升模型的性能和效率。原创 2024-10-17 22:15:21 · 26839 阅读 · 14 评论 -
UCI-HAR数据集深度剖析:训练仿真与可视化解读
UCI-HAR数据集是一个公开的数据集,旨在通过智能手机传感器数据进行人类活动识别。这个数据集由30名志愿者在进行日常生活活动时携带带有嵌入式惯性传感器的腰部智能手机生成。数据集中的活动包括行走、上楼梯、下楼梯、坐着、站立和躺着等六种基本活动。UCI-HAR数据集提供了原始的采样数据和经过预处理的数据。原始数据包括加速度计和陀螺仪的三轴数据,而预处理后的数据则包括时域和频域的特征向量。数据集中的每个样本都包含了丰富的特征信息,如加速度和角速度数据,以及从这些数据中提取的561种特征向量。Walking。原创 2024-10-12 14:09:17 · 31305 阅读 · 14 评论 -
基于四种网络结构的WISDM数据集仿真及对比:Resnet、LSTM、Shufflenet及CNN
残差网络是一种深度学习模型,通过引入“残差学习”的概念来解决深度神经网络训练困难的问题。ResNet沿用了VGG完整的3 × 3卷积层设计。残差块里首先有2个有相同输出通道数的3 × 3卷积层。每个卷积层后接一个批量规范化层和ReLU激活函数。然后我们通过跨层数据通路,跳过这2个卷积运算,将输入直接加在最后的ReLU激活函数前。残差块(Residual Block):输入通过一个或多个卷积层后,与输入相加,形成残差。原创 2024-10-03 18:38:18 · 35989 阅读 · 29 评论 -
CNN网络训练WISDM数据集:模型仿真及可视化分析
WISDM数据集是一个用于人类活动识别(Human Activity Recognition, HAR)的公共数据集。数据集来源与构成WISDM数据集由福特汉姆大学计算机与信息科学系的Gary Weiss博士领导的团队创建。数据集包含了51名参与者进行的18种不同的活动,每种活动的数据都是通过佩戴在身体不同部位的智能手机和智能手表上的加速度计和陀螺仪以20Hz的频率收集得到的。数据集特点数据集中的活动包括但不限于走路、跑步、上下楼梯、坐、站等。原创 2024-09-25 12:42:49 · 41952 阅读 · 19 评论 -
CIFAR-10数据集详析:使用卷积神经网络训练图像分类模型
CIFAR-10 数据集由 10 个类的彩色图像组成,每类6000张图像。有50000张训练图像和10000张测试图像。数据集分为5个训练批次和1个测试批次,每个批次有10000张图像。测试批次正好包含从每个类中随机选择的 1000 张图像。训练批次以随机顺序包含剩余的图像,但某些训练批次可能包含来自一个类的图像多于另一个类的图像。在它们之间,训练批次正好包含来自每个类的 5000 张图像。32×32 RGB图像 ,数据集本身是 BGR 通道。原创 2024-02-06 14:42:01 · 4570 阅读 · 7 评论 -
CIFAR-10数据集详析:使用卷积神经网络训练图像分类模型
CIFAR-10 数据集由 10 个类的彩色图像组成,每类6000张图像。有50000张训练图像和10000张测试图像。数据集分为5个训练批次和1个测试批次,每个批次有10000张图像。测试批次正好包含从每个类中随机选择的 1000 张图像。训练批次以随机顺序包含剩余的图像,但某些训练批次可能包含来自一个类的图像多于另一个类的图像。在它们之间,训练批次正好包含来自每个类的 5000 张图像。32×32 RGB图像 ,数据集本身是 BGR 通道。原创 2024-01-27 23:51:49 · 5291 阅读 · 38 评论 -
OpenCV实战:控制手势实现无触摸拖拽功能
Hello大家好,我是Dream。 今天来学习一下如何使用OpenCV来控制手势,瞬间提升操作体验!跨越界限,OpenCV手势控制拖拽功能现身。原创 2024-02-06 14:41:56 · 2898 阅读 · 5 评论 -
YOLOv5姿态估计:HRnet实时检测人体关键点
利用YOLOv5进行姿态估计,HRnet与SimDR检测图片、视频以及摄像头中的人体关键点。本文主要是用于工程应用,没有涉及算法训练。Hrnet或是simdr都是先目标检测后姿态估计,yolov5就是获得人体边界框的。全文较长,主要都是些代码,在最后也给大家展示了照片、视频、摄像头的展示代码,同时也分享了自己的报错,还是一次非常有意义有收获的实践!原创 2024-01-16 11:34:12 · 7326 阅读 · 87 评论 -
计算机视觉实战--直方图均衡化和自适应直方图均衡化
Hello大家好,我是Dream。 均衡化是数字图像处理中常用的一种技术,用于增强图像的视觉效果和对比度。,今天我们将实现对同一张图像的直方图均衡化和自适应直方图均衡化处理,学习一下两者的的基本原理和实现过程,一起来看看吧~原创 2023-08-08 23:46:09 · 7193 阅读 · 124 评论 -
计算机视觉--利用HSV和YIQ颜色空间处理图像噪声
Hello大家好,我是Dream。 今天我们将利用HSV和YIQ颜色空间处理图像噪声。在本次实验中,我们使用任意一张图片,通过RGB转HSV和YIQ的操作,加入了椒盐噪声并将其转换回RGB格式,最终实现对图像的噪声处理。一起来看看吧~原创 2023-07-26 11:46:40 · 4593 阅读 · 136 评论 -
计算机视觉--距离变换算法的实战应用
Hello大家好,我是Dream。 计算机视觉CV是人工智能一个非常重要的领域。 在本次的距离变换任务中,我们将使用D4距离度量方法来对图像进行处理。通过这次实验,我们可以更好地理解距离度量在计算机视觉中的应用。希望大家对计算机视觉和图像处理有了更深入的了解。让我们一起来看看实际的计算结果和可视化效果吧!原创 2023-07-24 15:15:34 · 8925 阅读 · 115 评论