视频运动放大一:欧拉视频放大,《Eulerian video magnification for revealing subtle changes in the world》

本文探讨了Eulerian Video Magnification (EVM)技术,如何通过结合光流法和泰勒级数,放大视频中的微妙变化,如皮肤色泽变化、微表情和微小运动。方法包括金字塔分解、滤波和一阶泰勒展开,展示了实验中放大脉搏的效果。但同时指出了放大可能带来的噪声放大问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

《Eulerian video magnification for revealing subtle changes in the world》(EVM)

目录

《Eulerian video magnification for revealing subtle changes in the world》(EVM)

背景

方法

实验

总结


背景

视频的时空处理相结合可以放大细微的变化,从而揭示周围世界的一些重要方面。如人类皮肤的颜色随血液循环而略有变化,细微表情和微小运动(脉搏,心率,桥梁变化等)等人类难以肉眼观测到的方面放大后,方便进行后续分析。

方法

如上图所示。EVM 是基于光流法并利用一阶泰勒展开来实现运动放大的一种经典方法。可以揭示和放大视频中的小动作和变化,EVM 首先将输入帧进行金字塔分解(空间分解),应用滤波于每个金字塔内的级别,而不是原始图片上的级别,因为目标是放大金字塔各个级别包含运动频率。然后,该技术将所需频率乘以放大系数α(由用户定义); EVM 放大实际运动并允许我们可以识别肉眼无法察觉的运动,所需的放大值频率被加回到相同级别的未放大的频率以获得最终视频夸张的动作。

下面分别解释上一自然段中黑色部分。


金字塔分解

金字塔分解,将图像应用高斯模糊核,将原图与模糊后的图像相减得到拉普拉斯金字塔。

即拉普拉斯金字塔是由高斯金字塔得来的,我们将原始图像通过与卷积核进行卷积以及隔行隔列的下采样(减小尺度),重复这一过程,我们就可以得到完整的高斯金字塔。

将高斯金字塔的最顶层隔行隔列且与同一卷积核卷积得到上采样图像,将同层的高斯金字塔与该上采样图像做差,得到与该层拉普拉斯金字塔,重复这一过程就得到全部的拉普拉斯金字塔。

如果我们用上采样图像与拉普拉斯金字塔对应层相加就会得到同层高斯金字塔,重复这一过程我们就能得到原始图像。(用于EVM最后的图像重建)


滤波

  欧拉视频放大采用标准视频序列作为输入,应用空间分解之后,然后对帧进行时域滤波。对特定信号放大之后,合成重构,得到结果。

  低通滤波:滤除高频成分保留低频成分的方法

  高通滤波:突出高频成分而使低频分量相对受到抑制的方法

  带通滤波:保留特定频段的波的同时屏蔽其他频段

如下为不同的滤波器

上图列举的有三种滤波器,理想带通滤波器、巴特沃斯滤波器、无限冲激响应滤波器。一般来讲对于颜色的放大,我们选择理想带通滤波器,而对于动作的放大我们考虑巴特沃斯滤波器或者无限冲激响应滤波器。这是因为颜色的变化比较静思,我们需要陡峭的截止频率,以防止颜色观察错误。而对于运动放大比较‘’粗放‘’,若选用的频域滤波器具有陡峭的变化,则会使滤波结果图像产生“振铃”现象,我们选用巴特沃斯滤波器或者无限冲激响应滤波器可以避免。

用I(x,t)表示图像在空间x处和在时间t处的强度,则有

其中δ (t)代表位移函数,即代表从0到t时刻x的变化。使用一阶泰勒级数展开,则得到如下分解式子,

 对I(x,t)使用带通滤波器进行滤波,δ (t)处于滤波的频带范围内,假设提取出了f(x)以外的所有信号,即B(x,t),如下


乘以放大系数α

 对上式子进行放大处理,即乘以放大因子α之后与原信号相加:

 联立上述式子,得到

 之后利用泰勒展开式可以得到输出信号

 上式子表明运动放大的整个过程,f(x)在时刻t的位移δ (t)被放大了(1+α)倍


加回

参考金字塔分解,重新看一下。


实验

我利用文章开源代码进行了实验,自行拍摄了一段脉搏变化的视频并进行放大,结果如下。无法上传视频好像,便截了关键图。

原始视频帧:

 放大后的脉搏:

总结

        由于基于光流思想的EVM算法采用修改运动区域像素值强度的方式实现运动信号的放大,当无法区分噪声信号和运动信号时,在放大信号的同时会一并将噪声放大,从而湮没运动信号,进而产生图像的伪影及运动信号的损坏,影响有效信息的提取。      

         EVM适合在高空间频率下使用较小的放大倍数,并且当放大倍数增加时会显著放大噪声。

本文为该运动放大系列下文章,系列目录如下:

运动放大、视频放大、Video Motion Magnification、Video Magnification_Alocus_的博客-优快云博客目录背景方法拉格朗日法欧拉法线性欧拉方法非线性欧拉方法深度学习法总结挖坑,运动放大。如果关注的伙伴们多,我会尽快更新,才疏学浅,我会把我了解到的知识在本系列中写出来。背景人类肉眼难以观察到细微的变化,然而重要的信息往往潜藏在其中,视频放大技术能够让我们更好地观察到视频中的这些变化,并对其进行深入的分析和利用。方法主要分三大类,拉格朗日法、欧拉法(线性、非线性)、深度学习法拉格朗日法《Motion magnification》欧拉法https://blog.youkuaiyun.com/Crystal_remember/article/details/116781912

评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Alocus_

如果我的内容帮助到你,打赏我吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值