- 博客(15)
- 资源 (8)
- 收藏
- 关注
原创 机器学习基础
1、基本概念1.1 发展历史 机器学习实际上已经存在了几十年或者也可以认为存在了几个世纪。追溯到17世纪,贝叶斯、拉普拉斯关于最小二乘法的推导和马尔可夫链,这些构成了机器学习广泛使用的工具和基础。1950年(艾伦.图灵提议建立一个学习机器)到2000年初(有深度学习的实际应用以及最近的进展,比如2012年的AlexNet),机器学习有了很大的进展。 从20世纪50年代研究机器学习以来,不同时期的研究途径和目标并不相同,可以划分为四个阶段。 第一阶...
2022-04-05 20:11:31
3481
原创 行人重识别初学习
行人重识别(Person Re-identification)又被称为行人再识别,如今被视为图像检索的一类关键子问题。它是利用计算机视觉算法对跨设备的行人图像或视频进行匹配,即给定一个查询图像,在不同监控设备的图像库检索出同一个行人,如图1.1所示。由于对智能安防、视频监控等方面有巨大的应用前景,行人重识别已经成为计算机视觉领域的研究焦点。行人重识别系统分为特征提取:能够学习并辨认不同摄像头下行人的变化特征度量学习:将学习到的特征映射到新的空间使得想同的人更近,不同的人更远图像检索:根据图片
2022-04-01 10:00:03
3554
原创 目标检测封装撞线计数函数
本文介绍了一个可复用的撞线计数模块LineCounter,该模块通过向量叉积判断目标是否穿越预设线段。模块初始化时需设置线段起止点,提供update()方法传入检测框数据(含目标ID和中心点坐标),内部维护轨迹历史进行方向判断,支持双向计数(count_in/count_out)并防止重复计数。主程序示例展示了该模块与YOLOv8目标检测的集成使用方式,通过可视化线段和实时显示进出数量,实现人流统计功能。该设计采用面向对象方式封装核心算法,支持重置计数和获取线段端点,具有较好的模块化特性。
2025-09-10 17:00:02
125
原创 用于在图像或视频帧上通过鼠标绘制矩形区域(ROI,Region of Interest),并提供一个辅助函数来判断点是否在某个区域内
本文介绍了一个交互式选择检测区域(ROI)的Python实现。该程序提供三种方式定义检测区域:1)按'r'键用鼠标绘制矩形区域;2)按'i'键手动输入归一化坐标;3)无操作时默认使用全图检测。核心功能通过OpenCV实现,包括鼠标回调事件处理、坐标转换和区域可视化。使用时只需调用select_roi_interactively()函数获取ROI多边形点集,配合目标检测算法判断目标是否在选定区域内。该方法支持灵活调整检测范围,适合需要特定区域检测的应用场景。
2025-09-10 16:48:47
255
原创 重新思考目标检测中的标注:标注小目标实例真的值得其成本吗?
论文题目Rethinking Annotation for Object Detection: Is Annotating Small-size Instances Worth Its Cost?文章🔗https://arxiv.org/pdf/2412.056111简介 在图像中检测仅占据很小区域的物体对人类来说都是困难的,即使是人类也是如此。因此,标注小尺寸物体实例既困难又昂贵。本研究挑战常识,提出了以下问题:标注小尺寸实例是否值得其成本?
2025-01-08 13:43:39
1121
原创 脱发因素影响MLP预测
使用 map 函数来应用映射到 DataFrame 的某一列(假设列名为 'Column_Name')# 假设 df 是你的 DataFrame,'Column_to_move' 是你想要移动的列名。# 创建一个新的列名列表,将 'Column_to_move' 放在最后。# 定义一个字典来映射 'yes' 到 1 和 'No' 到 0。# 获取除了 'Column_to_move' 以外的所有列名。删除多余的id,在训练中不起作用,并进行映射。# # 最后,将该列插回到最后一列的位置。
2024-04-11 11:35:18
680
2
原创 TransReID学习记录
提出了一个纯粹基于变压器的对象ReID框架,名为TransReID。具体来说,我们首先将图像编码为补丁序列,并通过一些关键改进构建基于变压器的强基线,这在基于cnn的方法的几个ReID基准上取得了具有竞争力的结果。为了进一步增强变压器背景下的鲁棒特征学习,精心设计了两个新的模块。(i)提出了拼图补丁模块(jigsaw patch module, JPM),通过移位和补丁洗牌操作重新排列补丁嵌入,生成鲁棒特征,提高了识别能力和覆盖范围的多样性。(ii)引入边信息嵌入(SIE),...
2022-08-27 20:48:08
4829
5
原创 VIT学习笔记
受到NLP领域中Transformer成功应用的启发,ViT算法中尝试将标准的Transformer结构直接应用于图像,并对整个图像分类流程进行最少的修改。具体来讲,ViT算法中,会将整幅图像拆分成小图像块,然后把这些小图像块的线性嵌入序列作为Transformer的输入送入网络,然后使用监督学习的方式进行图像分类的训练。之前的算法大都是保持CNN整体结构不变,在CNN中增加attention模块或者使用attention模块替换CNN中的某些部分。本文仅供学习参考使用,不做任何经济活动,侵权删除。...
2022-08-27 15:12:52
909
1
原创 Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform
SFTGAN
2022-04-24 19:40:13
4185
原创 手写字体识别MINST的两种方法
作为Pytorch初学者,利用MNIST数据集作为基本数据集,使用Pytorch进行搭建模型训练。MNIST数据集小,训练较容易。训练数据集的长度为:60000测试数据集的长度为:100001、方法一,线性连接层一共五层网络,第一层输入7844,第二层520,第三层320,第四层240,第五层120,最后输出分类字符0——9共十种类,因此,最后一层为10.该方法 简单。线性连接,准确率低。class Net(nn.Module): def __init__(self):
2022-04-04 16:53:51
1369
使用 YOLO 检测废弃行李 该项目旨在通过使用实时视频源和 YOLO(You Only Look Once)物体检测算法自动检测无人看管或遗弃的行李来提高公共交通安全
2025-08-20
计算机视觉领域中YOLOV5的Mosaic数据增强原理与应用
2025-01-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅