Local Compressed Video Stream Learning for Generic Event Boundary Detection

前由

通用事件边界检测旨在定位将视频分割成块的通用、无分类的事件边界。现有的方法通常需要在将视频帧馈送到网络之前对其进行解码,这包含显著的时空冗余并且需要相当大的计算能力和存储空间。为了解决这些问题,我们提出了一种新的压缩视频表示学习方法,用于事件边界检测,该方法完全利用压缩域中的丰富信息,即,RGB、运动矢量、残差和内部图像组(GOP)结构,而无需完全解码视频。具体而言,我们使用轻量级的ConvNets来提取GOP中的P帧的特征,并且空间信道注意模块(SCAM)被设计为基于具有双向信息流的压缩信息来细化P帧的特征表示

贡献点

1.我们改进了原来的SCCE提出了新的SCAM,细化的P-帧功能与I-帧功能,使用双向信息流。
2.我们建议利用LSTM模块来捕获时间信息,以获得更好的性能。

名词解释

1.GOP(group of pictures)

Group of Pictures (GOP) 在视频编码中是一个重要的概念。在视频压缩编码中,视频帧被分为不同类型,而 GOP 则定义了这些不同类型的帧如何被组织在一起。一个 GOP 由连续的视频帧组成,包括以下几种类型的帧:

I-frame(关键帧):Intra-coded picture,是一种独立的帧,它不依赖于其他帧来进行解码,通常包含完整的图像信息。在一个 GOP 中,通常第一帧是 I-frame。因为这样就能保证GOP不需要参考其他图像,可以独立解码。
P-frame(预测帧):Predicted picture,这些帧通过对前向或者后向的帧进行预测来进行编码,它们依赖于之前的一帧(通常是 I-frame 或者 P-frame)来进行解码。
B-frame(双向预测帧):Bi-directional predicted picture,这些帧通过对前后两帧进行预测来进行编码,它们依赖于之前和之后的帧来进行解码。

GOP 决定了这些不同类型的帧如何被安排组织在一起,以便进行有效的视频压

DSI compressed pixel stream 是一种用于 MIPI® DSI(Display Serial Interface)协议中的技术,旨在通过压缩像素数据来优化显示接口的带宽使用。MIPI DSI 是一种广泛用于移动设备嵌入式系统中的高速串行接口,用于连接显示控制器显示屏。通过压缩像素,可以减少数据传输所需的带宽,从而降低功耗并提高系统的效率。 ### 技术定义 DSI compressed pixel stream 指的是在 MIPI® DSI 接口中应用的一种压缩机制,将原本需要较高带宽传输的像素数据通过特定的压缩算法进行编码,以减少数据量。压缩后的像素通过 DSI 接口传输到显示设备,然后在显示设备端进行解压缩,恢复为原始的像素数据。 压缩技术可以采用不同的模式,例如帧缓冲压缩(Frame Buffer Compression, FBC)或显示压缩(Display Stream Compression, DSC)。FBC 是一种基于块的压缩方法,适用于重复的像素模式,而 DSC 是一种基于的压缩方法,能够提供更高的压缩率,并且支持视觉无损的图像质量 [^2]。 ### 用途 1. **节省带宽**:通过压缩像素数据,DSI compressed pixel stream 显著减少了传输相同显示内容所需的带宽。这对于高分辨率高刷新率的显示屏尤为重要,因为它们通常需要更大的带宽支持 [^2]。 2. **降低功耗**:压缩像素减少了数据传输量,从而降低了数据传输过程中所需的功耗。这对于移动设备来说尤为重要,因为功耗的降低可以直接延长设备的电池寿命 [^1]。 3. **提高灵活性**:压缩像素技术为 DSI 接口提供了更多的灵活性,允许在低带宽条件下实现高分辨率的显示输出。此外,压缩后的像素释放了更多的带宽资源,可用于其他数据传输任务,例如音频传输或传感器数据的复用 [^1]。 4. **支持多路传输**:压缩像素为 DSI 接口的多路复用提供了可能,即在同一个 DSI 链路上同时传输其他类型的数据(如控制信号或音频数据),从而简化了系统设计并提高了整体效率 [^1]。 ### 应用场景 DSI compressed pixel stream 广泛应用于需要高分辨率、低功耗高效带宽利用的设备中,例如智能手机、平板电脑、车载显示屏可穿戴设备。在这些场景中,压缩像素技术能够显著提升显示性能,同时优化系统资源的使用。 ```python # 示例代码:模拟 DSI 压缩像素的解码过程 def decode_compressed_pixel_stream(compressed_data): """ 模拟解码压缩像素的过程。 实际解码过程会涉及复杂的算法,例如基于 FBC 或 DSC 的解码。 """ # 这里仅模拟解码,实际解码过程需要依赖具体的压缩算法 decoded_data = [pixel * 2 for pixel in compressed_data] # 假设压缩过程中像素值被减半 return decoded_data # 示例数据:模拟压缩后的像素 compressed_pixel_stream = [50, 100, 75, 125, 200] decoded_pixel_stream = decode_compressed_pixel_stream(compressed_pixel_stream) print("Decoded Pixel Stream:", decoded_pixel_stream) ``` ### 总结 DSI compressed pixel stream 是一种通过压缩像素数据来优化 MIPI® DSI 接口性能的技术。它通过减少数据传输量,降低了功耗并提高了带宽利用率,同时为多路传输提供了可能性。这种技术在现代移动设备嵌入式系统中具有重要的应用价值。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值