
深度学习和计算机视觉
文章平均质量分 94
图像处理的算法是非常广泛的,从代数、几何、概率论、小波变换、傅里叶分析、数理方程等应有尽有。我们开一个栏目,专门针对这些数学理论应用展开讨论。
无水先生
擅长数学,能熟练应用泛函分析、统计学、随机过程、逼近论、微分几何、非欧几何(双曲、共形)等数学理论,有数学建模能力。从事图像处理二十年以上,从事人工智能行业10年以上;在船舶、通信、铁路、教育等行业开发软件产品。
展开
-
使用图网络和视频嵌入预测物理场
这是一篇国外流体力学专家在可视化流体物理属性的设计实现。我们知道物理模型多半是微分方程,而将微分粒子看成是训练数据,能否得出解的近似形式?本篇给出这样的启发。对于重事科研工作的人无疑是个启发。原创 2024-05-07 23:53:48 · 3008 阅读 · 0 评论 -
混合离散-连续几何深度学习
现有的球面卷积神经网络 (CNN) 框架既可计算可扩展又可旋转等变。连续方法捕获旋转等方差,但通常对计算要求过高。离散方法提供更有利的计算性能,但代价是等方差。我们开发了一种混合离散-连续 (DISCO) 群卷积,该卷积同时是等变的,并且在计算上可扩展到高分辨率。这种方法在许多基准密集预测任务上实现了最先进的 (SOTA) 性能。(更多细节可以在我们的ICLR论文中找到 DISCO卷积的可扩展和等变球形CNN。原创 2024-03-20 14:33:55 · 2776 阅读 · 0 评论 -
基于相位的运动放大:如何检测和放大难以察觉的运动(02/2)
日常物体会产生人眼无法察觉的微妙运动。在视频中,这些运动的幅度小于一个像素,但是,我们可以使用基于相位的视频放大来揭示这些不可见的运动,在这篇文章中,我们将用 Python 从头开始编码!如果您对理论感兴趣,我们在上一篇文章中对此进行了介绍。结果示例如图 6 所示。原创 2024-02-26 01:55:25 · 3536 阅读 · 6 评论 -
基于相位的运动放大:如何检测和放大难以察觉的运动(01/2)
当我第一次接触到运动放大时,我很惊讶,移动不到一个像素的东西怎么会有运动放大?没错,我们实际上可以检测和放大静态视频中难以察觉的运动,而且我们可以在不放大噪音的情况下做到这一点!这个概念有很多应用,并且已经在多个行业中使用。例如,结构和设备并不总是容易安装传感器。可靠的视觉技术可以成为快速识别和诊断问题的有效方法,这提供了低成本的结构分析。原创 2024-02-25 17:53:54 · 4445 阅读 · 4 评论 -
计算机视觉:高级图像处理,满足您的所有需求。
特征提取是机器学习管道中的关键步骤,可增强模型在不同数据集上的泛化和良好表现能力。特征提取方法的选择取决于数据的特征和机器学习任务的具体要求。本文揭示图像处理的数学原理,实现增强的计算机视觉原创 2024-01-29 17:42:04 · 3934 阅读 · 10 评论 -
主动轮廓——计算机视觉中的图像分割方法
简单来说,计算机视觉就是为计算机提供类似人类的视觉。作为人类,我们很容易识别任何物体。我们可以很容易地识别山丘、树木、土地、动物等,但计算机没有眼睛,也没有大脑,因此它很难识别任何图像。计算机只能理解命令和数学。因此,有很多技术可以让计算机识别各种物体。图像分割是目标检测的方法之一。原创 2024-01-19 01:05:03 · 3994 阅读 · 3 评论 -
【图像处理】使用Python进行实时人脸检测和识别
你有没有想过用Python构建一个面部识别系统?不要再看了!在本教程中,我们将使用 face_recognition 库来检测和识别视频流、图像甚至使用网络摄像头实时检测和识别人脸。原创 2023-07-04 14:44:44 · 9000 阅读 · 0 评论 -
探索 GoogLeNet:革命性的深度学习架构
在不断发展的深度学习和人工智能领域,强大的神经网络架构的发展有助于在各个领域取得突破性的成果。GoogLeNet,也称为 Inception-v1,代表了卷积神经网络 (CNN) 领域的一个关键里程碑。GoogLeNet 由 Google 研究人员于 2014 年开发,引入了一种构建高效且高度准确的深度网络的新颖方法。本文深入探讨了 GoogLeNet 在深度学习领域的架构、创新和影响。原创 2023-12-12 09:29:33 · 4329 阅读 · 0 评论 -
回顾 — SFA:简化快速 AlexNet(模糊分类)
在本文回顾了基于深度学习的模糊图像分类(SFA)。在本文中:Simplified-Fast-AlexNet (SFA)旨在对图像是否因散焦模糊、高斯模糊、雾霾模糊或运动模糊而模糊进行分类。原创 2023-11-13 11:21:52 · 6179 阅读 · 0 评论 -
用于强化学习的置换不变神经网络
如果强化学习代理提供的输入在训练中未明确定义,则通常表现不佳。一种新方法使 RL 代理能够正常运行,即使受到损坏、不完整或混乱的输入的影响也是如此。原创 2023-11-10 11:18:23 · 3773 阅读 · 0 评论 -
深度学习的集体智慧:最新发展综述
我们调查了来自复杂系统的想法,如群体智能、自组织和紧急行为,这些想法在机器学习中越来越受欢迎。人工神经网络正在影响我们的日常生活,从执行预测性任务(如推荐、面部识别和对象分类)到生成任务(如机器翻译和图像、声音、视频生成)。但是,随着所有这些进步,深度学习的惊人壮举需要大量复杂的工程工作。原创 2023-11-10 10:22:17 · 3102 阅读 · 0 评论 -
揭开堆叠式自动编码器的强大功能
在不断发展的人工智能和机器学习领域,深度学习技术因其处理复杂和高维数据的能力而广受欢迎。在各种深度学习模型中,堆叠式自动编码器是一种多功能且功能强大的工具,可用于特征学习、降维和数据表示。本文探讨了堆叠式自动编码器在深度学习领域的架构、工作原理、应用和意义。原创 2023-11-08 00:45:07 · 3459 阅读 · 0 评论 -
MapReduce:大数据处理的范式
在当今的数字时代,生成和收集的数据量正以前所未有的速度增长。这种数据的爆炸式增长催生了大数据领域,传统的数据处理方法往往不足。MapReduce是一个编程模型和相关框架,已成为应对大数据处理挑战的强大解决方案。本文探讨了MapReduce的概念、其原理、应用及其对数据处理世界的影响。原创 2023-11-05 14:45:22 · 3847 阅读 · 1 评论 -
【图像处理】对象检测:YOLO最新
物体检测是计算机视觉中最重要的任务之一,使机器能够识别和定位图像和视频中的物体。此任务的一个流行架构是你只看一次(YOLO)[2]。它于 2015 年提出,从那时起有多个版本,提高了物体检测的速度和准确性。在本教程中,我们将查看它的三个第一个版本。原创 2023-07-04 18:48:29 · 2994 阅读 · 0 评论 -
用于医学图像分割的分段任意模型 (SAM)
在不断发展的人工智能 (AI) 领域,医学成像是一个正在经历深刻变革的领域。乘着这一变革浪潮,Facebook 的(现为 Meta)研究小组开发了一种突破性的模型架构,称为 SegmentAnything (SAM)。SAM 的卓越之处在于它能够为图像中的不同对象生成分割掩模。这种自适应质量使其能够执行医学成像中的无数任务,从分割日常物体到照亮医学图像中的特定结构。原创 2023-10-11 07:38:27 · 3783 阅读 · 0 评论 -
Xception:使用Tensorflow从头开始实现
近年来,卷积神经网络已成为计算机视觉领域的主要算法,开发设计它们的方法一直是相当的关注。Inception模型似乎能够用更少的参数学习更丰富的表示。它们是如何工作的,以及它们与常规卷积有何不同?本文将用tensorflow实现,用具体实践展现它的结构。原创 2023-10-10 11:11:24 · 3944 阅读 · 0 评论 -
使用 TensorFlow 创建 DenseNet 121
本篇示意DenseNet如何在tensorflow上实现,DenseNet与ResNet有类似的地方,都有层与层的“短路”方式,但两者对层的短路后处理有所不同,本文遵照原始论文的技术路线,完整复原了DenseNet的全部网络。原创 2023-10-07 16:11:26 · 6343 阅读 · 0 评论 -
EfficientNetV2:更快、更小、更高精度
EfficientNets是目前最强大的卷积神经网络(CNN)模型之一。随着视觉变压器的兴起,它实现了比高效网络更高的精度,出现了CNN现在是否正在消亡的问题。EfficientNetV2 不仅通过提高准确性,还通过减少训练时间和延迟来证明这是错误的。本文中,详细讨论了这些CNN的开发,它们有多强大,以及它对CNN在计算机视觉中的未来有何看法。原创 2023-10-07 15:50:27 · 3718 阅读 · 0 评论 -
目标检测如何演变:从区域提议和 Haar 级联到零样本技术
物体检测算法的发展已经取得了长足的进步,从早期的计算机视觉开始,通过深度学习达到了很高的准确度。在这篇文章中,我们将研究这些算法的发展阶段以及现代目标检测系统中使用的主要方法。原创 2023-09-27 10:20:20 · 3674 阅读 · 0 评论 -
PyTorch 模型性能分析和优化 — 第 2 部分
这是关于分析和优化在GPU上运行的PyTorch模型的系列文章的第二部分。在我们的第一篇文章中,我们展示了使用 PyTorch Profiler 和TensorBoard迭代分析和优化PyTorch模型的过程和巨大潜力。原创 2023-09-24 11:27:22 · 5457 阅读 · 0 评论 -
使用 PyTorch 的计算机视觉简介 (6/6)
本文主要介绍CNN中在pytorch的实现,其中MobileNet 网络,数据集来源,以及训练过程,模型生成和存储,模型调入等。原创 2023-09-24 06:34:43 · 5354 阅读 · 0 评论 -
使用 PyTorch 的计算机视觉简介 (4/6)
在本单元中,我们将了解卷积神经网络(CNN),它是专门为计算机视觉设计的。 多层卷积层允许我们从图像中提取某些图像模式,池化层,以及在CIFAR-10上的表现。原创 2023-09-23 12:12:12 · 5351 阅读 · 0 评论 -
使用 PyTorch 的计算机视觉简介 (5/6)
本文主要介绍CNN中在pytorch的实现,其中VGG16网络,数据集来源,以及训练过程,模型生成和存储,模型调入等。原创 2023-09-23 08:12:43 · 5604 阅读 · 0 评论 -
使用 PyTorch 的计算机视觉简介 (3/6)
在本单元中,我们将了解卷积神经网络(CNN),它是专门为计算机视觉设计的。卷积层允许我们从图像中提取某些图像模式,以便最终分类器基于这些特征。原创 2023-09-21 10:27:46 · 3299 阅读 · 3 评论 -
使用 PyTorch 的计算机视觉简介 (1/6)
Computer Vision(CV)是一个研究计算机如何从数字图像和/或视频中获得一定程度的理解的领域。理解这个定义具有相当广泛的含义 - 它可以从能够区分图片上的猫和狗,到更复杂的任务,例如用自然语言描述图像。原创 2023-09-19 18:11:59 · 5789 阅读 · 1 评论 -
ML在2023年最成功的案例:ControlNet
这里说的ControlNet不是工业控制的控制网络,而是深度学习的神经网络植入某些控制环节,它是 2023 年 ML 领域最大的成功案例之一。这是一种简单,可解释的方式来对扩散模型的输出施加影响的模型。原创 2023-08-14 16:47:03 · 6337 阅读 · 0 评论 -
自动编码器:揭开数据压缩和重建的奥秘
你有没有想过数据是如何压缩、传输和重建的?自动编码器是人工智能世界中一个引人入胜的概念,它正是实现这一目标的。想象一下,一个神奇的盒子,它接受复杂的信息,压缩成简化的形式,然后把它恢复到原来的形状——就像科幻电影中的神奇运输车一样。在本文中,我们将揭开自动编码器的奥秘,并提供一个简单的分步指南来从头开始编写自动编码器。原创 2023-08-16 15:50:34 · 6183 阅读 · 2 评论 -
使用 PyTorch 进行高效图像分割:第 3 部分
在这个由 4 部分组成的系列中,我们将使用 PyTorch 中的深度学习技术从头开始逐步实现图像分割。本部分将重点介绍如何使用深度可分离卷积来优化我们的 CNN 基线模型,以减少可训练参数的数量,使模型可部署在移动设备和其他边缘设备上。原创 2023-08-18 09:18:16 · 4104 阅读 · 0 评论 -
使用 PyTorch 进行高效图像分割:第 1 部分
在这个由 4 部分组成的系列中,我们将使用 PyTorch 中的深度学习技术从头开始逐步实现图像分割。我们将在本文中从图像分割所需的基本概念和想法开始本系列。原创 2023-08-17 17:50:14 · 5207 阅读 · 0 评论 -
使用 PyTorch 进行高效图像分割:第 2 部分
这是由 4 部分组成的系列的第二部分,旨在使用 PyTorch 中的深度学习技术从头开始逐步实现图像分割。本部分将重点介绍如何实现基线图像分割卷积神经网络(CNN)模型。原创 2023-08-17 17:33:40 · 4454 阅读 · 0 评论 -
1x1 卷积:解释器
在这篇博客中,我们将尝试深入探讨 1x1 卷积操作的概念,该概念出现在 Lin等人 (2013) 的论文“网络中的网络”和 Szegedy 等人 (2014) 的论文“Go Deep with Convolutions” 中,该论文提出了 GoogLeNet 架构。原创 2023-08-17 16:26:47 · 3817 阅读 · 0 评论 -
使用 PyTorch 进行高效图像分割:第 4 部分
在这个由 4 部分组成的系列中,我们将使用 PyTorch 中的深度学习技术从头开始逐步实现图像分割。本部分将重点介绍如何实现基于视觉转换器的图像分割模型。原创 2023-08-17 14:01:00 · 4568 阅读 · 0 评论 -
使用AffNet和HardNet进行图像匹配
我们有一个任务是找到与给定查询图像最匹配的图像。首先,我们在OpenCV中尝试了使用SIFT描述符和基于Flann的匹配器的经典图像匹配。结果是完全错误的。然后是词袋...最后,找到了AffNet和HardNet。原创 2023-08-14 15:41:58 · 4324 阅读 · 0 评论 -
使用 PyTorch 逐步检测单个对象
在对象检测任务中,我们希望找到图像中对象的位置。我们可以搜索一种类型的对象(单对象检测,如本教程所示)或多个对象(多对象检测)。通常,我们使用边界框定义对象的位置。原创 2023-08-12 14:21:20 · 4702 阅读 · 1 评论 -
【深度学习】采用自动编码器生成新图像
你知道什么会很酷吗?如果我们不需要所有这些标记的数据来训练 我们的模型。我的意思是标记和分类数据需要太多的工作。 不幸的是,大多数现有模型从支持向量机到卷积神经网,没有它们,卷积神经网络就无法训练。无监督学习不需要标注。无监督学习从未标记推断函数 数据本身。最著名的无监督算法是K-Means,它具有 广泛用于将数据聚类到组中和 PCA,这是首选 降维解决方案。K-Means和PCA可能是最好的两个 曾经构思过的机器学习算法。让他们变得更好的是 他们的简单性。我的意思是,如果你抓住它们,你会说:“我为什原创 2023-08-05 09:23:10 · 5577 阅读 · 0 评论 -
用于大型图像模型的 CNN 内核的最新内容
由于OpenAI的ChatGPT的巨大成功引发了大语言模型的繁荣,许多人预见到大图像模型的下一个突破。在这个领域,可以提示视觉模型分析甚至生成图像和视频,其方式类似于我们目前提示 ChatGPT 的方式。原创 2023-08-05 08:30:28 · 5520 阅读 · 0 评论 -
【图像处理】使用 OpenCV 将您的照片变成卡通
在当今世界,我们被图像和视频所包围。从社交媒体到广告,图像已成为一种强大的交流媒介。但是你有没有想过,如果你能把你的照片变成卡通会发生什么?想象一下,为您最喜欢的照片创建动画版本,或者将肖像转换为异想天开的插图。原创 2023-07-27 12:45:07 · 6466 阅读 · 3 评论