
计算机视觉
文章平均质量分 93
驼驼学编程
在校大学生,记录一些日常学习内容
展开
-
从图像“看出动作”
在一段视频中,持续地追踪一个目标的位置和状态。比如:你要一直追踪视频中的某一个人他从左走到右,视频有 30 帧你要知道每一帧他在哪里(用框框框住他)特性Kalman 滤波粒子滤波运动建模线性可非线性噪声分布高斯任意分布表达方式高斯均值+协方差一堆粒子(样本)是否支持多峰估计❌✅(可多个猜测)速度快较慢目标不止一个的时候,我们要“同时追踪多个目标”,而且要“知道谁是谁”。算法用途是否用外观速度稳定性SORT实时场景❌⚡ 非常快❌ 容易ID错。原创 2025-04-16 00:07:26 · 530 阅读 · 0 评论 -
目标检测与分割:深度学习在视觉中的应用
全模型端到端训练(backprop 到最前面)精度高,速度比前两者快成为基准检测器(benchmark)就是要让模型对图像中的“每一个像素”做出分类。换句话说,它不再是识别整张图里有没有狗,而是要把“狗的每个像素”标出来。语义分割:你知道哪些像素是“人”,但不知道有几个“人”实例分割:你不仅知道哪些像素是“人”,还知道是第1个人、第2个人…比如:语义分割 → 把 3 个苹果都标为 class=apple实例分割 → 给 3 个苹果不同 mask(Apple1, Apple2, Apple3)原创 2025-04-15 21:06:04 · 1195 阅读 · 0 评论 -
CV深度学习
定义:深度学习是机器学习(Machine Learning)中的一个分支,它利用**多层的人工神经网络(Neural Networks)**来模拟人脑的处理方式,自动地从大量数据中提取特征。“深度”含义:指的是网络中的隐藏层(hidden layers)数量多,比如 5 层、10 层甚至上百层,能够从数据中提取越来越抽象的表示(representation)。完整训练流程是:数据加载(图像/标签);网络前向传播(输出预测);计算损失(loss);反向传播误差;更新权重;重复上述过程直到收敛。原创 2025-04-04 18:23:13 · 994 阅读 · 1 评论 -
cv图像分割
cv图像分割原创 2025-03-27 22:18:47 · 757 阅读 · 0 评论 -
cv模式识别
模式识别是一门研究如何使计算机或系统能够自动识别各种数据模式(如图像、语音、文本、传感器信号等)的技术和科学。它广泛应用于人脸识别、语音识别、指纹识别、文本分类、医学图像诊断等领域。根据输入数据的特征,对其进行分类或识别。数据样本(可能是图像、声音、信号等),表示为向量形式。分类标签(如“猫”或“狗”)、分数、概率等。📌给定一张图片,系统要判断它是猫还是狗。图像的像素就是特征,通过算法分析这些像素的模式,来做出分类。缩写全称实际类别预测类别举例TP正正猫被识别为猫TN负负。原创 2025-03-26 00:37:09 · 705 阅读 · 0 评论 -
特征表示深度解析:颜色、纹理、形状与编码
特征表示深度解析:颜色、纹理、形状与编码原创 2025-03-09 21:59:42 · 1151 阅读 · 0 评论 -
空间域与频域图像处理
仅基于单个像素的灰度值进行变换,不依赖邻域信息。原创 2025-03-08 10:00:00 · 897 阅读 · 0 评论 -
图像形成与计算机视觉基础
通过以上内容,可系统掌握图像处理的基础操作,并为后续高级技术(如滤波、分割)奠定基础。原创 2025-03-06 23:28:22 · 1170 阅读 · 0 评论