- 博客(36)
- 收藏
- 关注
原创 Ollama 安装与使用全攻略及 Open WebUI 配置指南
例如,使用查看版本的命令,在命令行中输入相关指令,若能正确显示 Ollama 的版本信息,则说明安装成功且可以正常使用。搜索 “WSL” 查找最新版 msi 安装包)下载最新版本的 WSL,选择 msi 文件进行下载安装,安装完成后需要重启电脑。中断下载进程,然后重新运行下载命令,Ollama 支持断点续传,重新下载时速度会明显加快。下载完成后,在之前设置的。进行更新,但由于该命令可能需要读取服务器,存在失败的风险,因此直接下载安装包更为稳妥。,浏览丰富的大语言模型列表,根据自己的需求选择想要下载的模型。
2025-06-30 17:47:56
1295
原创 手把手教会--Bytetrack跑通第一个demo(附常见问题解决办法)
ByteTrack目标跟踪项目部署指南摘要:本文介绍了高性能多目标跟踪算法ByteTrack的完整部署流程,包括环境搭建、项目解压、虚拟环境创建(Python 3.8)、依赖安装(requirements.txt+额外库)和预训练权重配置。重点解析了项目目录结构,并针对三大常见问题(yolox模块导入失败、ONNX/protobuf兼容性、numpy版本问题)提供了详细解决方案。最后说明成功运行演示程序后,系统将输出带有目标ID和边界框的跟踪视频。
2025-06-22 02:27:06
849
1
原创 数据集CrowdHuman概述
人群场景下的人体检测是计算机视觉领域的重大挑战,现有数据集在人群密度和遮挡程度方面存在明显不足。Megvii团队提出的CrowdHuman数据集填补了这一空白,包含15,000张高密度图像(平均每图22.6人)和470,000个标注实例,提供全身体、可见区域和头部三种标注。实验表明,基于该数据集训练的模型在COCOPersons、Caltech等基准测试中表现出优异的跨数据集泛化能力。CrowdHuman为拥挤环境下人体检测研究提供了更全面的评估基准,对自动驾驶、智能监控等应用具有重要价值。
2025-05-28 23:51:00
1036
原创 数据集DanceTrack概述
DanceTrack论文提出了一种针对外观相似且运动复杂场景的多目标跟踪数据集。该数据集包含100个视频、超10万帧,特点是舞者着装高度相似(Re-ID特征余弦距离仅0.2)且运动模式复杂(位置切换频率是MOT17的2.5倍)。实验表明,现有依赖外观的MOT算法性能平均下降25%,而纯运动模型表现更好。研究验证了分割掩码、人体姿态等细粒度信息对性能的提升效果,指出未来应强化运动动态建模和跨模态融合。该工作为开发不依赖外观的跟踪范式提供了新基准。
2025-05-28 23:35:22
812
原创 MOT评价指标
多目标跟踪(MOT)的评价指标主要分为综合性能指标(如HOTA、MOTA、IDF1)和细分维度指标(如AssA、DetA、IDSW)。HOTA通过调和平均平衡检测与关联精度,是目前最全面的指标;MOTA侧重整体性能但忽略误差类型差异;IDF1专注身份连续性评估。补充指标还包括轨迹连续性指标(MT/ML、Frag)和场景特异性指标(ORR、3D MOT)。实践建议结合任务需求选择指标组合,并利用标准数据集和可视化工具辅助分析,其中HOTA适用于复杂场景,IDF1适合长期跟踪任务,MOTE则关注算法效率。
2025-05-28 23:01:46
996
原创 目标跟踪SAM2MOT概述
SAM2MOT通过分割驱动的零样本跟踪运动感知记忆管理和交互式校正机制,重新定义了多目标跟踪的泛化能力与遮挡处理标准。任务解耦创新:首次将MOT与目标检测完全解耦,彻底摆脱对检测器的依赖,推动MOT技术向通用化、智能化演进;数据高效性:无需特定场景标注数据,直接利用SAM2的零样本分割能力,显著降低部署成本;工业级实用性:支持实时推理与交互式校正,为安防、自动驾驶等领域提供了可落地的高精度跟踪方案。
2025-05-28 17:15:22
884
原创 目标跟踪ByteTrack概述
ByteTrack通过高低置信度分级匹配动态轨迹管理和轻量级设计,重新定义了多目标跟踪的实时性与精度平衡标准。遮挡处理创新:首次系统性利用低置信度检测框修复遮挡轨迹,显著提升复杂场景下的跟踪鲁棒性;工业级实用性:轻量级架构与实时推理能力,推动MOT技术在安防、自动驾驶等领域的规模化落地;范式突破:通过简单有效的关联策略,为后续算法(如BoT-SORT、Light-ByteTrack)的发展提供了重要参考。
2025-05-28 16:55:22
1151
原创 目标跟踪FairMOT概述
FairMOT通过Anchor-Free检测多层特征融合和低维Re-ID设计,重新定义了多目标跟踪的基线标准。任务解耦创新:首次实现检测与Re-ID的端到端联合优化,为实时MOT系统提供了高效解决方案;特征平衡突破:通过高低层特征聚合与低维向量设计,显著提升遮挡场景下的跟踪鲁棒性;工业级实用性:轻量级架构与实时推理能力,推动MOT技术在安防、自动驾驶等领域的落地应用。
2025-05-27 23:54:08
760
原创 目标跟踪CrossMOT概述
CrossMOT通过跨视角特征对齐动态时空图建模和无监督域自适应,重新定义了多目标跟踪的范式。多模态融合创新:首次实现多视角传感器数据的端到端联合建模,为动态场景提供了更鲁棒的跟踪解决方案;跨域泛化突破:无监督域自适应机制显著提升模型在未见过场景下的性能,推动MOT技术向实际应用迈进一步;工业级实用性:即插即用的模块设计,支持快速集成到现有系统,为自动驾驶、智慧安防等领域提供高精度、低延迟的解决方案。
2025-05-27 23:51:03
1268
原创 目标跟踪SOTMOT概述
SOTMOT通过动态目标先验建模时空注意力增强匹配和无监督域自适应,重新定义了多目标跟踪的范式。任务融合创新:首次实现SOT与MOT的无缝结合,为动态场景提供了更鲁棒的跟踪解决方案;跨域泛化突破:无监督域自适应机制显著提升模型在未见过场景下的性能,推动MOT技术向实际应用迈进一步;工业级实用性:即插即用的模块设计,支持快速集成到现有系统,为自动驾驶、智慧安防等领域提供高精度、低延迟的解决方案。
2025-05-27 23:47:46
847
原创 目标跟踪Deep OC-SORT概述
Deep OC-SORT通过动态外观特征融合和相机运动补偿,重新定义了基于运动模型的多目标跟踪范式。精度与效率的平衡:在保持OC-SORT实时性的同时,通过轻量级外观模块显著提升遮挡场景下的跟踪鲁棒性;多场景适应性:相机运动补偿和动态EMA设计,使其在车载、无人机等动态视角场景中表现优异;工业级实用性:即插即用的模块设计,支持快速集成到现有MOT系统,为自动驾驶、智慧安防等领域提供低成本高可靠的解决方案。
2025-05-27 22:07:05
1172
原创 目标跟踪OC SORT概述
OC-SORT通过观测中心的轨迹关联策略重新定义了基于运动模型的多目标跟踪范式。纯运动模型的极限突破:在不依赖外观特征的情况下,显著提升遮挡场景下的跟踪鲁棒性;实时性与可扩展性:轻量级设计支持边缘设备部署,且各模块可灵活集成到其他框架;工业级实用性:通过OOS、OCM、OCR的协同优化,为自动驾驶、视频监控等场景提供了低成本高可靠的解决方案。
2025-05-27 21:58:32
1118
原创 目标跟踪StrongSORT概述
StrongSORT通过对DeepSORT的检测能力、特征表示、关联策略和后处理模块的全面升级,重新定义了检测-跟踪范式的性能天花板。其核心价值在于证明:即使不依赖复杂的端到端架构,通过系统性优化传统框架并引入轻量级即插即用模块,仍能在多目标跟踪中实现精度与效率的双重突破。AFLink和GSI的设计尤其体现了对工业落地场景的考量——以极低计算成本解决遮挡和轨迹断裂等痛点。作为当前MOT领域的标杆基线,StrongSORT不仅推动了学术研究的发展,也为自动驾驶、智慧安防等产业应用提供了可靠的技术支撑。
2025-05-27 21:50:00
912
原创 目标追踪Deepsort概述
DeepSORT通过“深度外观特征+级联匹配”的设计,首次在多目标跟踪中实现了“运动-外观”联合建模,为实时场景提供了兼顾精度与效率的解决方案。其核心框架启发了后续算法对特征表示(如Re-ID模型升级)、匹配策略(如时序关联增强)和轨迹管理(如遮挡恢复机制)的持续优化。尽管存在计算开销和泛化性挑战,DeepSORT仍是工业界落地最广泛的多目标跟踪算法之一,其思想在机器人、安防、交通等领域具有持久的应用价值。
2025-05-27 21:35:43
1632
原创 目标跟踪SORT概述
极致轻量:仅依赖检测框位置信息,无外观特征提取,计算复杂度极低(260 FPS);实时性突破:首次证明MOT可在CPU上实现实时性(200+ FPS),远超同期算法(如MDP仅10 FPS);开源价值:代码不足300行,成为后续MOT算法的标准基线(如DeepSORT、FairMOT均基于此改进)。学术意义:证明“简单模型+高质量检测”可实现高效MOT,启发后续研究聚焦“检测-跟踪”联合优化;工程价值:作为实时跟踪的基线方案,至今仍是工业界快速落地的首选(如安防监控、自动驾驶初版方案)。
2025-05-27 21:19:15
1006
原创 GAP v.s. FCL
全局平均池化(Global Average Pooling, GAP)是一种用于卷积神经网络(CNN)的池化操作,通常在网络的末端替代传统的全连接层。:替代全连接层,避免参数爆炸(如ResNet-50中全连接层有2048×1000=2M参数,而GAP无需额外参数)。GAP替代全连接层,简化模型结构;(B为批次大小,C为通道数,H为高度,W为宽度),经过GAP后输出变为。:GAP不依赖特征图的空间尺寸(H×W),支持可变大小的输入图像。:GAP后接一个全连接层(或无全连接层,直接Softmax)。
2025-04-17 20:37:25
787
原创 KF V.S. GM-PHD
基于线性动态模型和高斯噪声假设,通过“预测-更新”循环迭代估计目标的状态(如位置、速度)。• 从后验PHD中提取高斯分量,保留权重大于阈值的分量作为目标状态估计。• 根据上一时刻的PHD(高斯混合形式)和运动模型,预测当前PHD。:直接估计所有目标的联合概率密度(PHD),避免显式数据关联。• 将检测、运动估计、关联模型端到端训练,平衡精度与效率。:将目标和观测建模为随机集合,处理目标出现、消失和杂波。• 依赖线性模型,难以处理复杂运动(如急转弯)。• 自动处理目标数量的变化(新生、消失)。
2025-04-14 23:18:38
983
原创 自注意力的机制内涵和设计逻辑
• 当解码器生成目标语言中的动词时,Q会与编码器的K计算相似度,发现源语言中对应的动词和主语位置(高注意力权重)。它的意义类似于人类阅读一段文字时,动态关注不同部分(例如前文的关键词、后文的解释等),而非机械地逐字处理。模型会强化对任务有用的V特征(例如,在翻译中正确对齐的词语)的权重,同时抑制无关特征,形成端到端优化。:计算每个查询(Q)与所有键(K)的相似度(即注意力分数),反映当前位置与其他位置的相关性。中,处理“吃”时,Query(“吃”)会和 Key(“猫”、“鱼”)有较高相似度。
2025-04-14 23:11:09
963
原创 目标追踪数据标注
(首选):支持视频插值标注、自动ID分配,导出格式兼容YOLO和DeepSORT。:对于高帧率视频(如30fps),可每隔2-3帧标注(需保持ID连续性)。:标注关键帧(首尾帧),中间帧用线性插值生成伪标注,人工复查修正。:目标离开画面超过N帧(如30帧)后,可视为永久消失。:同时满足检测(类别+框)和追踪(跨帧ID)的需求。:目标短暂消失(如被遮挡)后重新出现,仍用原ID。:使用全部标注数据(70%训练,30%验证)。:仅需边界框和类别(无需Track ID)。:群体目标(如密集人群)需明确拆分规则。
2025-04-14 23:09:11
1581
原创 Transformer的Word Embedding
上下文动态调整:通过自注意力机制捕捉长距离依赖,解决一词多义。预训练赋能:在大规模语料上预训练,使词嵌入包含丰富的世界知识。位置感知:显式编码位置信息,弥补无时序结构的缺陷。端到端学习:嵌入层与模型其他部分联合优化,适应具体任务需求。
2025-04-05 16:46:31
1171
原创 温度参数T在softmax上的引用
温度T是深度学习中的“分布调节器”,通过缩放Softmax的输入空间,实现对模型行为从微观(概率分布)到宏观(任务表现)的控制。其核心价值在于平衡探索(多样性)与利用(确定性),这一思想已渗透至生成模型、蒸馏学习、对比学习等前沿领域。实际应用中需结合任务目标动态调整,方能最大化其效用。
2025-04-03 14:13:14
897
原创 Dataset vs DateLoader
通过二者的配合,PyTorch实现了高效、灵活的数据加载流水线,适用于从简单分类任务到大规模图像/视频处理的复杂场景。关注数据流动(如批量、加速)。,用于定义如何访问原始数据(如文件路径、标签、预处理规则)。包装为可迭代对象,支持批量生成、多进程加速、数据打乱等。的数据读取和预处理(例如图像裁剪、归一化)。,允许子进程预加载数据(避免主进程阻塞)。关注数据本身(如路径、标签、预处理),而。对大型数据(如图像)使用内存映射文件(如。的逻辑(如合并多个样本的张量)。(如批量、顺序、加速),是连接。
2025-04-02 23:21:28
572
原创 ViT 处理流程
( N = \frac{224}{16} \times \frac{224}{16} = 14 \times 14 = 196 ),远低于直接处理像素(50K),大幅降低计算量。:在编码器基础上增加交互注意力层(Cross-Attention),用于融合编码器输出(作为K、V)和当前解码输入(作为Q)。:通过全连接层或等效的卷积操作(如768个16×16卷积核,步长16),将向量映射到目标维度(如768维)。• 每个块(如16×16×3的RGB块)被拉平为向量(16×16×3=768维)。
2025-04-02 23:10:30
882
原创 Python子类调用父类 super()方法
在 Python 中,子类调用父类的属性和方法有多种方式,具体取决于是否要直接访问属性、是否要重写方法,以及是否涉及多继承。合理使用这些方法,可以确保子类既能复用父类代码,又能灵活扩展功能。的(无下划线前缀),子类可以直接通过。决定多继承时的调用顺序,子类必须显式调用父类的。
2025-03-29 15:47:44
619
原创 Python的私有方法和私有属性
是一种约定性的封装机制,用于限制对类内部细节的直接访问。尽管 Python 没有严格意义上的“私有”成员(所有成员最终仍可访问),但通过命名规则和设计模式,可以实现类似效果。合理使用私有成员,可以让代码更健壮、更易维护!标记私有成员(方法和属性),这会触发。:外部代码无法通过常规方式访问私有成员。Python 会将私有成员重命名为。机制,使外部无法直接访问。在 Python 中,
2025-03-29 15:22:57
1828
原创 求1-100的和的几种方法
1.循环#include<stdio.h>int main() {int i,sum;for (i = 1, sum = 0; i <= 100; i++) {sum = sum + i;}printf("%d", sum);}2.静态局部变量#include<stdio.h>int main() {int sumAdd(int n);//函数的声明int i;for (i = 1; i < 100; i++) { sumAdd(i);}
2020-11-24 18:21:24
4275
原创 求三个数中的最大数
#include<stdio.h>int main() { int a, b, c, max; scanf_s("%d %d %d", &a, &b, &c); if (a > b) { max = a; } else { max = b; } if (c > max) { printf("%d", c); } else { printf("%d", max); }}
2020-11-24 17:23:37
252
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅