【CS231n】十一、计算机视觉的一些问题:分割、定位、检测

本文介绍了计算机视觉领域的几个核心概念和技术,包括语义分割、图像分类与定位、物体检测及物体分割。详细解释了每种技术的基本原理及其应用场景,如使用CNN进行语义分割、在AlexNet中加入Box输出实现物体定位、R-CNN系列算法及其改进方法在物体检测中的应用,以及结合多种技术实现物体分割。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、语义分割(Semantic Segmentation)
给图像的每一个像素(pixel)分入一个类别,每个类别有相应的语义或者标签。
分类但不区分实例(instances),比如两只重叠的猫,所有的像素都归为 cat 一类。

使用CNN来完成,结构有一些变化,如下:
【CS231n】十一、计算机视觉的一些问题:分割、定位、检测

这里需要讨论一下的不同于CNN的操作:
(1)上采样 upsampling——Unpooling 反池化
【CS231n】十一、计算机视觉的一些问题:分割、定位、检测
这样做的好处:又一次的补充了由于maxpooling损失的空间信息。

(2)Transpose Convolution(也叫deconvolution) 反卷积
input一个2*2的image,反卷积即每一个pixel乘以之前所使用的相应的filter,
【CS231n】十一、计算机视觉的一些问题:分割、定位、检测
卷积与反卷积的矩阵表示(能够看出为什么这里称为转置卷积):
【CS231n】十一、计算机视觉的一些问题:分割、定位、检测


2、Classification+Localzation 图像分类+物体定位
以AlexNet应用为例,在全连接层增加四个Box输出(x,y,w,h),方框的位置和高度宽度。
训练过程中,则需要计算两个不同的loss,称为multi-task loss(多任务损失函数),给不同的超参weights给这两个loss。(很tricky)

同样的方法也可以用在人体姿势(点位)的识别。


3、Object Detection 物体识别
在物体周围框图,并识别为类别集中的某一类。与上问题不同的是,并不能确定有多少个物体需要识别。所以不能使用输出固定个数的方框的方法。
另一个想法:对于图像的每一个区域进行判别,判别是背景还是某一种物体。问题在于 图像区域有大有小,滑过全部区域,巨大的量,通过卷积网络,就是巨大的计算量。

所以介绍一下三种基于Region 的方法。

(1)R-CNN
这里使用 Region Proposals 的方法。通过edges给出1000个可能存在物体的box。一个常见的Region Proposal算法称为 Selective Search。
有一些问题在于,给出的box具有不同的大小,而ConvNet希望输入的图像有相同的大小。所以需要将图形变形成同样的大小(warp image regions)。需要补充的是,R-CNN同样还会对之前的Box进行调整,以达到最佳的效果。同时这个方法仍然有一定的计算量。
【CS231n】十一、计算机视觉的一些问题:分割、定位、检测

(2)Fast R-CNN (减少计算量)
首先将图片通过一个ConvNet,得到的是高解析度的feature map,而后对这个feature map使用Region Proposals。接下来同样对这些大小不同的方框进行变形,这里有所不同,使用ROI pooling layer。然后通过FC层进行分类和判别。
这个结构训练和判断都非常快,在判断的阶段,Region Proposal函数的计算时间实际成了最主要的因素。于是有了下节的优化结构。
【CS231n】十一、计算机视觉的一些问题:分割、定位、检测

(3)Faster R-CNN
因为Region Proposal的计算成了瓶颈,所以我们使用神经网络去代替Region proposal算法。
【CS231n】十一、计算机视觉的一些问题:分割、定位、检测



还有不使用基于Region的方法,如YOLO(You Only Look Once)\ SSD(Single Shot Detection)

(4)SSD
想法是,不像之前独立地处理可能的region,我们想像处理回归问题一样,使用大型的ConvNet统一地进行预测。
输入一个图像,把其划分为 粗粒度 网格,如下图,分为7*7的网格。每一个网格中间,有一个box的集合,图中集合大小为3。现在我们想要预测:1、物体到box的偏移;2、分类打分,即指定分类的物体在这个box里的可能性大小。

【CS231n】十一、计算机视觉的一些问题:分割、定位、检测


4、物体分割(Instance Segmentation)
等于是 确定每一个像素点 属于哪一个物体。下面这个模型 更像之前讨论的 模型的组合。

【CS231n】十一、计算机视觉的一些问题:分割、定位、检测
可以取得非常好的结果
【CS231n】十一、计算机视觉的一些问题:分割、定位、检测


资源下载链接为: https://pan.quark.cn/s/abbae039bf2a 无锡平芯微半导体科技有限公司生产的A1SHB三极管(全称PW2301A)是一款P沟道增强型MOSFET,具备低内阻、高重复雪崩耐受能力以及高效电源切换设计等优势。其技术规格如下:最大漏源电压(VDS)为-20V,最大连续漏极电流(ID)为-3A,可在此条件下稳定工作;栅源电压(VGS)最大值为±12V,能承受正反向电压;脉冲漏极电流(IDM)可达-10A,适合处理短暂高电流脉冲;最大功率耗散(PD)为1W,可防止器件过热。A1SHB采用3引脚SOT23-3封装,小型化设计利于空间受限的应用场景。热特性方面,结到环境的热阻(RθJA)为125℃/W,即每增加1W功率损耗,结温上升125℃,提示设计电路时需考虑散热。 A1SHB的电气性能出色,开关特性优异。开关测试电路及波形图(图1、图2)展示了不同条件下的开关性能,包括开关上升时间(tr)、下降时间(tf)、开启时间(ton)和关闭时间(toff),这些参数对评估MOSFET在高频开关应用中的效率至关重要。图4呈现了漏极电流(ID)与漏源电压(VDS)的关系,图5描绘了输出特性曲线,反映不同栅源电压下漏极电流的变化。图6至图10进一步揭示性能特征:转移特性(图7)显示栅极电压(Vgs)对漏极电流的影响;漏源开态电阻(RDS(ON))随Vgs变化的曲线(图8、图9)展现不同控制电压下的阻抗;图10可能涉及电容特性,对开关操作的响应速度和稳定性有重要影响。 A1SHB三极管(PW2301A)是高性能P沟道MOSFET,适用于低内阻、高效率电源切换及其他多种应用。用户在设计电路时,需充分考虑其电气参数、封装尺寸及热管理,以确保器件的可靠性和长期稳定性。无锡平芯微半导体科技有限公司提供的技术支持和代理商服务,可为用户在产品选型和应用过程中提供有
资源下载链接为: https://pan.quark.cn/s/9648a1f24758 在 JavaScript 中实现点击展开与隐藏效果是一种非常实用的交互设计,它能够有效提升用户界面的动态性和用户体验。本文将详细阐述如何通过 JavaScript 实现这种功能,并提供一个完整的代码示例。为了实现这一功能,我们需要掌握基础的 HTML 和 CSS 知识,以便构建基本的页面结构和样式。 在这个示例中,我们有一个按钮和一个提示框(prompt)。默认情况下,提示框是隐藏的。当用户点击按钮时,提示框会显示出来;再次点击按钮时,提示框则会隐藏。以下是 HTML 部分的代码: 接下来是 CSS 部分。我们通过设置提示框的 display 属性为 none 来实现默认隐藏的效果: 最后,我们使用 JavaScript 来处理点击事件。我们利用事件监听机制,监听按钮的点击事件,并通过动态改变提示框的 display 属性来实现展开和隐藏的效果。以下是 JavaScript 部分的代码: 为了进一步增强用户体验,我们还添加了一个关闭按钮(closePrompt),用户可以通过点击该按钮来关闭提示框。以下是关闭按钮的 JavaScript 实现: 通过以上代码,我们就完成了点击展开隐藏效果的实现。这个简单的交互可以通过添加 CSS 动画效果(如渐显渐隐等)来进一步提升用户体验。此外,这个基本原理还可以扩展到其他类似的交互场景,例如折叠面板、下拉菜单等。 总结来说,JavaScript 实现点击展开隐藏效果主要涉及 HTML 元素的布局、CSS 的样式控制以及 JavaScript 的事件处理。通过监听点击事件并动态改变元素的样式,可以实现丰富的交互功能。在实际开发中,可以结合现代前端框架(如 React 或 Vue 等),将这些交互封装成组件,从而提高代码的复用性和维护性。
一、AutoCAD 2016的工作界面 组成要素:由应用程序菜单、标题栏、快速访问工具栏、菜单栏、功能区、命令窗口、绘图窗口和状态栏组成。 1. 切换至AutoCAD 2016 1)工作空间 模式类型:提供草图与注释、三维基础、三维建模三种工作空间模式 二维绘图功能:在草图与注释空间中可使用默认、插入、注释、参数化、视图管理等选项卡进行二维图形绘制 切换方法: 快速访问工具栏→工作空间按钮下拉列表 状态栏→切换工作空间按钮下拉列表 三维功能:三维基础空间包含可视化、坐标、长方体等三维建模工具 2)应用程序菜单 置:于界面左上角 核心功能: 搜索命令 文件操作(新建/打开/保存/另存为/输出/发布/打印/关闭) 最近文档管理(可按日期/大小/类型排序) 选项设置(打开选项对话框) 3)标题栏 显示内容:当前程序名称(Autodesk AutoCAD 2016)和文件名称 信息中心功能: 帮助搜索 Autodesk账户登录 软件更新检查 窗口控制(最小化/最大化/关闭) 4)菜单栏 显示设置:通过自定义快速访问工具栏→显示菜单栏选项启用 菜单结构:包含文件、编辑、视图、插入等11个主菜单项 命令示例: 绘图→直线:进入直线绘制模式 绘图→圆弧:提供三点、起点-圆心-端点等11种绘制方式 5)选项卡和面板 组织结构: 选项卡(默认/插入/注释等) 面板(绘图/修改/注释等) 命令按钮(直线/多段线/圆等) 操作流程:单击命令按钮→绘图区操作→Enter键确认 6)工具栏 调用方式:工具→工具栏→AutoCAD→选择所需工具栏 控制方法: 显示:勾选对应工具栏选项 隐藏:取消勾选或点击工具栏关闭按钮 示例操作:绘图工具栏包含直线、构造线等绘图工具按钮 7)绘图窗口 主要功能:核心绘图工作区域 导航控制: 滚动条调整视图 模型/布局空间切换 显示
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值