- 博客(20)
- 收藏
- 关注
原创 人工智能原理复习资料
智能是指人或系统获取知识、理解、学习、推理、判断、解决问题和适应环境的能力。人工智能是使机器具备类似人类智能的能力,如学习、推理、规划、理解自然语言和视觉等。
2025-04-19 16:45:21
628
原创 【机器学习】PCA-奇异值分解-上采样与下采样-傅里叶变换
将数据尺寸放大,如将 32×32 图像放大成 64×64。或**奇异值分解(SVD)**来完成。,将原始高维数据映射到较低维空间,同时尽可能保留原始信息。快速傅里叶变换(FFT):高效实现 DFT 的算法。主成分分析(PCA)是一种常用的数据降维方法。平均池化(Average Pooling)离散傅里叶变换(DFT):数字信号分析工具。奇异值大小反映了数据的“能量”分布。最大池化(Max Pooling)步长卷积(Stride > 1)图像滤波(如高通/低通滤波),揭示信号中的频率成分。
2025-04-18 15:56:47
577
原创 【cv】先验框优化
先验框(Anchor Box)是目标检测模型在预测过程中使用的一种预定义的矩形框。这些框的尺寸和形状事先固定,用于估计图像中可能存在的目标的位置和大小。在模型训练时,先验框会与真实目标框进行匹配,并根据匹配结果调整预测框的位置和大小。通过K-means聚类对先验框进行优化,是根据实际数据集中的目标特征,自动生成一组适应性更好的先验框尺寸。这样可以增强模型对不同大小和形状目标的检测能力,提升目标检测任务的整体性能。
2024-08-30 17:19:40
393
原创 【cv】双目相机
双目相机利用两个摄像头拍摄的图像的视差(两个摄像头的视角差异)来获取场景的深度信息。具体来说,双目相机拍摄的左视图和右视图之间的像素位置差异(视差)用于计算场景中物体的深度。这些光学图像是通过相机的成像传感器捕捉到的场景的二维图像,类似于人眼看到的视角。:根据相机的几何参数(如基线距离、焦距等)以及计算出的视差值,通过三角测量的方法计算每个像素点的深度信息,生成深度图像。:这是由双目相机的左摄像头拍摄的图像,通常与右视图具有一定的视差,视差的大小与场景中的物体距离相机的远近相关。双目相机采集的图像主要是。
2024-08-29 22:24:09
245
原创 【cv】多帧平均或高斯混合模型(GMM)建立流水线的背景模型
多帧平均适合静态且稳定的背景,方法简单且计算效率高。**高斯混合模型(GMM)**适合背景可能存在变化的场景,鲁棒性更强,但计算复杂度较高。如果背景稳定且变化不大,可以选择多帧平均方法;如果背景有可能变化(如光照变化),则GMM会是一个更好的选择。
2024-08-29 22:19:36
1799
原创 【cv】双目立体标定与立体校正
Bouguet立体校正是计算机视觉中一种常用的立体矫正方法,它基于OpenCV库的立体校正工具,通常用于处理立体相机系统中的图像对齐和校正。该方法的主要目标是通过几何变换,使得两台相机的视差只沿水平方向变化,从而简化立体匹配算法的实现。
2024-08-28 20:41:24
588
原创 deepsort-detection(自学)
方法将左上角坐标和宽高转换为中心坐标、宽高比和高度。这种转换可以根据具体的应用场景选择合适的表示方式,方便不同算法之间的集成和交互。计算了边界框宽度的一半和高度的一半,然后加到左上角坐标上,得到了中心坐标。对象的属性,将输入的边界框位置信息、置信度和特征向量存储为对象的属性。类用于表示图像中的一个目标检测结果,其中包含了目标的位置信息和特征。这两个方法提供了不同的边界框坐标表示格式之间的转换。方法将左上角坐标和宽高转换为左上角和右下角坐标,而。的副本,确保在后续的计算中不会影响到原始的。
2023-10-07 20:38:41
117
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人