茶桁
这个作者很懒,什么都没留下…
展开
-
如何加速 CNN
本节课为「」第 17 节;Hi, 我是茶桁。上节课咱们讲了 MLP 到 CNN,最后提到了 CNN 加速的话题。具体 CNN 加速这个过程我们要从两个方向去看,一个是前向计算的加速,一个是反向传播的加速。我们通常说模型加速前向计算就够了,不用反向传播。并不是如此。为什么?因为如果一个模型它的训练很快的话,它前向计算其实就可以更快。比如说一个模型。为什么模型现在做不了,参数量更大,做不了更准确,就是因为我们训练速度慢,训练不出来。模型本身的潜力是很大的,但是我们没有训练出来。原创 2024-09-22 07:45:00 · 87 阅读 · 0 评论 -
计算机视觉的常用模型
好,这就是咱们这节课的内容,主要讨论了一下计算机视觉的常用模型,并且讲之后课程的内容概要给大家讲了讲。这节课内容其实蛮重要的,对于已经大致了解的同学作用不太大,对于刚进入计算机视觉这个领域的同学,大家可以趁机去查一下我说的这些个模型,做一个预习,好接下来跟上咱们后续的课程。我们原来使用 GPU 必须是通过 PyTorch, Tensorflow 等一些框架去使用的,那么我们通过 pycuda 就可以直接去使用 GPU 了,直接去调用 GPU 的一些API,GPU 的一些驱动函数。自己写或者用工具箱都可以。原创 2024-09-01 07:45:00 · 111 阅读 · 0 评论 -
作业, 识别图像数字
这就是说,我们去做决策的时候,去设计传统的机器学习模型的时候,我们这个特征是需要手动去调整的。我们上节课学了提特征了,学了提 hog 特征,之后 LBP 特征和哈尔特征遗留下来了,我们这节课把它补充上去。,一共是 2 个 1,那行投影的第一个数字就是 2,第二行也是如此,之后每一行都是如此,一直到最后一行都是 0,没有一个 1,所以行投影矩阵的最后一个数字是 0。第一列,0 个 1,是 0,第二列,3,第三列,2,第四列,2,第五列,3,第六列,0。OK,数据我们拿到了,也把数据的矩阵打印出来了。原创 2024-08-25 07:45:00 · 91 阅读 · 0 评论 -
图像特征描述子
本节课为「」第 12 节;可直接在橱窗里购买,或者到文末领取优惠后购买:Hi, 大家好。我是茶桁。。其中上节课内容中我们提到了一些决策函数改进的点。在解决计算机视觉问题的过程,我们除了决策函数之外,另外一个关键点就是「描述子」。在这节课中,咱们就来好好聊聊。原创 2024-08-18 07:30:00 · 83 阅读 · 0 评论 -
特征及决策函数
本节课为「」第 11 节;可直接在橱窗里购买,或者到文末领取优惠后购买:Hi,大家好。我是茶桁。。在这节课中,咱们继续来深入讲讲这个概念。原创 2024-08-11 19:05:19 · 65 阅读 · 0 评论 -
直方图及均衡化
Hi, 大家好。我是茶桁。今天咱们来讲直方图,以及直方图的均衡化。这是很有意思的一部分。本来上一节课咱们就该讲讲直方图的,可是因为直方图的内容确实有点多,所以就放在这一节课咱们拿一章来好好讲讲。在理解直方图之前,最好还是好好看看上一节课的内容,因为灰度图和 gamma 的概念对于理解直方图算是一些基础了。好了,话不多说,让我们开始。原创 2024-07-28 07:30:00 · 672 阅读 · 0 评论 -
计算机视觉核心步骤
有的大一些,有的小一点,有的偏左,有的偏右。这样的模型的参数量就太大了,不合适。更深一步就是,无论我们 1 的角度如何变化,就算 1 在图片上是斜着的,是倒着的,我们特征都是不变的。在这个函数中,我们输入数字 8 的这个矩阵,我希望输出 id=1,输入数字 1 的矩阵,我希望输出 id=2,如果是数字 6 的矩阵,我希望输出 id=3。如果当前输入的矩阵是等于 8 的这个矩阵,这个我们是知道的,那么我就 return 8,就是直接输出了一个结果数字, return 1 呢,就是输出了第一类的 ID。原创 2024-08-04 07:30:00 · 92 阅读 · 0 评论 -
灰度和 gamma 值
前面咱们花了 6 节正课以及 1 节作业课的时间讲了图像处理的方法。哪些图像处理方法同学们还记得吗?我们了解了图像是用矩阵表示的,然后,我们如何获取到图像这个矩阵对吧?先获取到这个矩阵才能对它进行处理。我们讲了从图片上读取、从摄像头中读取、从视频中读取,也可以自己生成一个矩阵来表示图片。当然还有些其他方法。我们现在先认识这 3 种基本上就够用了。还有一些其他的方法就比如说卫星上的扫描图像,它可能不是可见光的,是各个电磁波根据它反射的性能出来的矩阵,比如近红外的图像,热成像仪等等。这都是形成图像数据的方法。原创 2024-07-21 07:30:00 · 82 阅读 · 0 评论 -
作业:人像滤波去噪
所以我就布置个作业,让大家去调整一下卷积核的大小和值,尝试去把卷积核的大小调成一个合适的值,然后对这个模特的脸上的一些斑点进行一个过滤,只剩下模特除了斑点之外的其他的部分。对于普通人来说,这肯定是一下说不出来的,需要接受专门的练习,理解了三原色色值的差别以及融合原理,我们需要大量的经验去积累,自己调调试试。如果在,它就是肤色了,我就给一个图片,另外有一个 skin 这个图片,它存取肤色的结果,并且我们给设置为二值图像,也就是只有黑白两个颜色。如果是,就设置为 1,如果不是,就设置为 0。原创 2024-07-14 07:30:00 · 106 阅读 · 0 评论 -
计算机处理图像的方式方法(下)
本节课为「」第 6 节;Hi, 大家好。我是茶桁。INFO:在正式开始今天课程之前,先跟大家说一个决定。本来「茶桁的 AI 秘籍」系列课程都是一周两篇的频率进行更新的,但是近期由于本人诸多事项缠身比较忙,又都不能不耽误,所以之后不得不改为一周一篇的更新频率,为每周周日进行更新。除了系列课程之外,其他零散的文章依旧不定时更新,可能一天一更,也可能需要等比较长的时间。做这样的决定也是为了保障课程或者文章的质量,还请大家见谅。原创 2024-07-10 07:30:00 · 64 阅读 · 0 评论 -
计算机处理图像的方式方法
那到现在为止,咱们就完成了把这个图像给读进来的功能,包含了三种方式,我们都能拿到矩阵并且能显示了,也就初步完成了我们这个照相机的功能。,讲到这里聪明的小伙伴应该已经理解了,这个其实就是通道转换的一个 CV 方法,专门用于将读取进来的图像的第一矩阵和第三矩阵换一个位置,从而得到一张正常显示的图片。我们看到了两张图,一个是二维矩阵的图,一个是三维矩阵的图。我们去写了一个简单的矩阵,从这个矩阵能看出来,咱们只写了一个二维矩阵,这种矩阵最后生成的结果应该是一个灰度图,图片的 shape 为 3*3。原创 2024-07-07 07:30:00 · 94 阅读 · 0 评论 -
计算机是如何看到图像的
首先,镜头完成一个图像的采集,采集的是电压的值。我们这个感光元器件只能看它的分辨率是多少,就是它的最小的感光元器件多少,它测的是最小的感光元器件的区域所有的光线之和的强度。到现在为止,我们图像的显示方式讲了几种:一个是二值图,这个图的取值方式是 0 和 1,数据类型是整型,然后是灰度图,每个像素的取值范围是 0~1 的浮点数,或者是 0~255 的整型。不过这个显示出来之后是一个黑白的图像,如果我们最后存到的值只有 0,1 这两个值,这时候的图片我们叫它二值图,它显示出来就是非黑即白的这种图片。原创 2024-07-03 07:30:00 · 144 阅读 · 0 评论 -
Computer Vision 的由来
本节课为「计算机视觉 CV 核心知识」第 3 节课;「AI秘籍」系列课程:人工智能应用数学基础人工智能Python基础人工智能基础核心知识人工智能BI核心知识人工智能CV核心知识Hi, 大家好。我是茶桁。咱们这节课来讨论一下计算机视觉的发展过程。我们想看它的由来,首先看一下计算机视觉这个名字。计算机视觉,computer vision,把这两个单词拆解来看:computer 就是计算机的意思,vision 就是视觉的意思,所以我们下面就计算机和视觉两个角度去看一下计算机视觉。那么从原创 2024-06-30 14:41:32 · 160 阅读 · 0 评论 -
计算机视觉的职业规划
Hi,大家好。我是茶桁。今天这节课呢,咱们先不着急讲原理,先来讲讲的话题。如果想要直接上手企业级的 AI 项目,可以看看咱们的「原创 2024-06-26 07:30:00 · 555 阅读 · 0 评论