A xell
这个作者很懒,什么都没留下…
展开
-
计算机视觉基础知识(一)--数学基础
向量线性变换矩阵充满数字的表格矩阵加减法要满足两个矩阵的行数与列数一致; 加法交换律:A+B=B+A矩阵乘法要满足A的列数等于B的行数;单位矩阵是一个nxn矩阵; 从左到右对角线上的元素值为1; 其余元素为0; A为nxn矩阵,I为单位矩阵,; 单位矩阵在乘法中的作用相当于数字1;逆矩阵矩阵A的逆矩阵记做; ; I是单位矩阵奇异矩阵没有逆矩阵的矩阵称为奇异矩阵; 当且仅当矩阵的行列式为零时,该矩阵奇异;当a原创 2024-03-04 10:28:07 · 1473 阅读 · 0 评论 -
计算机视觉基础知识(二)---数字图像
【代码】计算机视觉基础知识(二)---数字图像。原创 2024-03-03 22:46:33 · 1603 阅读 · 0 评论 -
计算机视觉基础知识(十三)--推理和训练
Keras由纯Python编写;基于theano/tensorfolw的深度学习框架;是一个高层神经网络API;支持快速实验,将idea迅速转化为结果;原创 2024-02-19 16:32:59 · 1939 阅读 · 1 评论 -
计算机视觉基础知识(十六)--图像识别
图像识别信息时代的一门重要技术; 目的是让计算机代替人类处理大量的物理信息; 随着计算机技术的发展,人类对图像识别技术的认识越来越深刻; 图像识别技术利用计算机对图像进行处理\分析\理解,识别不同模式的目标和对象; 过程分为信息的获取\预处理\特征抽取和选择\分类器设计\分类决策;模式识别是人工智能和信息科学的重要组成部分; 指对表示事物或现象的不同形式的信息做分析和处理,得到对事物或现象描述\辨认和分类的过程; 计算机图像识别技术是模拟人类的图像识别过程; 在图像识别的过程中进行模原创 2024-03-02 22:05:08 · 3516 阅读 · 0 评论 -
计算机视觉基础知识(十五)--卷积神经网络
自我增强;削弱别人;原创 2024-02-25 10:44:53 · 2105 阅读 · 0 评论 -
计算机视觉基础知识(十四)--深度学习开源框架
是一个编程系统;使用图来表示计算任务;图中节点表示operation,称为op;一个op获取0个或多个Tensor,计算产生0个或多个Tensor;一个Tensor是一个类型化的多维数组;比如一个小的图像集可以表示为一个思维浮点数组;四个维度分别为:【batch,height,width,channels】;TensorFlow按图计算,图必须在会话里被启动;会话将图的op分发到CPU或GPU设备上,同时提供执行op的方法;方法执行后将产生的Tensor返回;原创 2024-02-21 20:18:07 · 1125 阅读 · 0 评论 -
计算机视觉基础知识(十二)--神经网络与深度学习
人是怎么思考的?--生物神经网络由相互联系的神经元组成;神经元具有权重;根据训练期间的错误更新偏差;找到一个未知函数的近似解;原创 2024-02-17 21:19:43 · 1399 阅读 · 1 评论 -
计算机视觉基础知识(四)--特征选择、特征提取
定义:从N个特征中选择M个子特征(M<=N);并且在M个子特征中,准则函数达到最优解;特征选择的原则:选择尽可能少的子特征;模型的效果不会显著下降;结果的类别分布尽可能接近真实类别分布。常见特征:边缘,角,区域。原创 2024-01-15 18:22:42 · 2687 阅读 · 0 评论 -
计算机视觉基础知识(零)--人工智能初步
关于怎么做的一系列指令叫做算法传统算法:遍历法更聪明的算法:梯度下降法更复杂的算法:机器学习个人观点:新的预测也应对模型权重有所反馈,因为人就是在不断的学习过程中逐步提高我们的认知水平,不应该把机器的学习割裂为训练和预测,都是学习的过程。机器要怎么思考?--人工神经网络深度神经网络&深度学习传统的神经网络发展到了多层隐藏的情况具有多个隐藏层的神经网络称为深度神经网络基于深度神经网络的机器学习称为深度学习。对图像中的客观对象构建明确而有意义的描述从一个或多个数字图像中计算三维世界的特征。原创 2024-01-02 15:28:29 · 918 阅读 · 0 评论 -
计算机视觉基础知识(十)--尺度不变特征变换(SIFT)
图像金字塔--对一个原始图片不断地进行分辨率的减少,然后将得到的图片摞在一起,组成一个四棱锥,这个椎体称为图像金字塔;尺度空间--描述一个图片需要获得多少不同分辨率的图片;试图在图像领域中模拟人眼观察物体的概念和方法;对不同尺寸的物体,分别观察细节和整体的能力;最高级别分辨率的图像放在最底部;网上是一系列分辨率逐次降低的图片。对原始图像进行多尺度像素采样;最顶部是只含一个像素的图片;以多分辨率来解释图像的结构。生成N个不同分辨率的图像;这是传统意义上的金字塔。原创 2024-01-30 14:32:02 · 1601 阅读 · 1 评论 -
计算机视觉基础知识(十一)--OpenCV算法解析
举例说明:某产品的利润在售价为2元\5元\10元时分别为4元\10元\20元;商品的利润与售价的关系符合直线:y=2x;上述关系中,"2"称为回归系数,即斜率;回归系数表示商品的售价x变动一个单位时,利润y与之对应的变动关系;线性回归表示离散点总体上"最逼近"哪条直线;;这是一个无约束最优化的问题;分别对k和b求偏导,令偏导数为0,可得极值点;;散列函数或散列算法又称哈希函数:Hash Function;一种从任何一种数据中创建小的数字"指纹"的方法;原创 2024-01-30 19:59:52 · 1419 阅读 · 1 评论 -
计算机视觉基础知识(九)--图像聚类算法
目的是把数据分开;事先不知到如何去分;完全由算法来判断数据之间的相似性;相似的数据放到一起;在聚类的结论出来之前,完全不知到每一类的特点;对聚类的结果需要由人的经验来分析,各类的特点;聚类的思想是“物以类聚”;分类是通过标签来训练得到一个模型;再对新数据进行预测;分类训练的数据具有标签;绝大多数层次聚类属于凝聚型层次聚类;只在簇间相似性的定义上不同;原创 2024-01-22 14:15:15 · 1776 阅读 · 0 评论 -
计算机视觉基础知识(八)--点云模型
点云数据是最常见也是最基础的三维模型;扫描数据以点的形式记录;每一个点包含有三维坐标;有些肯能含有颜色信息;或者反射强度信息(Intensity)。原创 2024-01-21 22:50:45 · 2550 阅读 · 1 评论 -
计算机视觉基础知识(七)--立体视觉
1.立体视觉立体视觉定义一种计算机视觉技术; 目的是从两幅或以上的图像中推理出图像中每个像素点的深度信息;立体视觉应用领域机器人; 辅助驾驶/无人驾驶 无人机立体视觉的原理借鉴了人类双眼的“视差”原理; 左、右眼对于物体的观测存在差异; 大脑利用左、右眼的差异,使得人类能够辨识物体的远近。单目系统O为相机的光心; 是摄像头的成像平面; P和Q为空间中的两个点; 缺点:对重合的两个点P和Q无法提供深度信息2.双目系统&视差双目系统极平面:三原创 2024-01-17 16:21:46 · 633 阅读 · 0 评论 -
计算机视觉基础知识(六)--相机模型
1.相机模型针孔相机模型四个坐标系世界坐标系: 摄像机坐标系: 图像物理坐标系: 图像像素坐标系:世界坐标系客观三维世界的绝对坐标系; 也称客观坐标系; 物体在真实世界中的坐标; 随着物体的大小和位置的变化而变化; 单位是长度单位;相机坐标系以相机的光心为坐标系的原点; 以平行于图像的x和y方向为x轴和y轴; z轴和光轴平行; x,y,z互相垂直; 单位是长度单位;图像物理坐标系以光轴和图像平面的交点为坐标原点; 和轴平行于图像的(垂直)边界; 单位是原创 2024-01-17 13:39:28 · 1229 阅读 · 0 评论 -
计算机视觉基础知识(五)--边缘提取
图像的边缘指图像局部区域亮度变化显著的部分;该区域的灰度剖面可看做一个阶跃;从一个灰度值在很小的缓冲区域内急剧变化到另一个相差较大的灰度值;边缘有正负之分;由暗到亮为正;由亮到暗为负;边缘检测是图像灰度变化的度量、检测和定位。好的检测:算法能够尽可能的标出图像中的实际边缘;好的定位:标识出的边缘要与实际的图像中的边缘尽可能接近;最小响应:图像中的边缘只能标记一次;原创 2024-01-17 06:25:25 · 1746 阅读 · 0 评论 -
计算机视觉基础知识(三)---图像滤波器
最常用 最常见。原创 2024-01-15 10:29:05 · 1621 阅读 · 0 评论