二、OpenVINO简述与构建流程

OpenVINO是Intel提供的开放视觉推理工具,支持AI应用的构建。它包括模型优化器,将训练模型转换为中间表示IR文件,以适应推理引擎。视频分析流程涵盖解码、预处理、推理和编码,OpenVINO的Media-SDK用于编解码,DLDT用于推理加速。通过性能评测和选择合适系统,实现高效视频分析处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

二、OpenVINO简述与构建流程

1 人工智能与视觉应用

1. 计算机视觉与图像处理
  • 图像: 在计算机中,每张图像是由像素构成的阵列,表示为像素值。通常在灰度图中,像素仅单个通道,每个像素值的区间为0 ~ 255,其中255表示白色,0表示黑色。而在彩色RGB图像中,每个像素由R、G、B三个通道组成,每个通道中的像素值区间均为0 ~ 255。

  • 视频: 如果说图像是多个像素构成的阵列,那么视频则是由一系列连续图像组成的序列,当图像切换速度足够快时,就形成了平滑连续的视觉效果。如在电影视频中,每秒24帧指的是视频每秒放映的画面数,一幅画面就是一帧,连续的24帧构成了视频一秒内的输出内容。至于为什么看24帧的电影毫无违和感,而60帧以下的游戏却会感觉到明显卡顿,这里就涉及到动态模糊,现实光影在记录时会因为动态模糊存在“多余”的丰富图像信息,而游戏3D实时渲染却不会存在这些动态模糊带来的“多余”信息,其间的差异就造成了观看时的卡顿感。至于动态模糊的概念,这里暂且不做过多赘述。

  • 图像处理

    • 模糊:平滑处理每个像素及其周围的8个像素值,选取其平均值作为该点的像素值,即可获得更加模糊的图像。

    • 锐化:扩大像素点与周围像素点的差异,将会得到更锐利的图像。继续进行锐化,图像将仅保留像素值的显著差异,只能看到图像中物体的边缘,可用于检测图像的角、边缘、线等

      在这里插入图片描述

    • 边缘:在RGB图像中,边缘常常存在于像素值剧烈变化处。因此常常针对这一特征进行物体边缘检测。可以检测图像中的边缘、线、角作为图像特征,由此查找真实图像

      在这里插入图片描述

2. 视频压缩技术与加速处理
  • 视频压缩技术: 假设在未经压缩的情况下,1080P 25帧视频的一帧由1920×1080个像素点组成,每个像素点有RGB三个通道,大小约3 bytes。此时一帧图像约为6.2 MB,每秒需要155 MB存储空间,那么一分钟视频约为9.3 GB。为了压缩这些数据,达到通过较少比特去呈现大量数据,同时不丢失太多信息的目的。就需要利用视频压缩,即冗余技术。

  • 冗余:

    • 空间冗余:在一系列图像内,天空区域所有像素都是相同颜色,此时无需存储每张图像中天空区域的全部像素,仅需存储该区域所有像素的平均值,在显示时应用到天空区域内每个像素上即可。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Aaaaaki

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值