注:英语太烂基础太差,本翻译文档仅供本中自己参考。而且包含一大堆自己YY的意译。
注:MPEG-DASH标准第一版为ISO/IEC 23009-1
编号:ISO/IEC JTC1/SC29/WG11 N15819
时间:2015年10月
标题:MPEG-DASH白皮书(空间关系描述)第一部分第二次修订版
一、简介
超高分辨率(4K、8K及以上)视频的出现与日渐多元化的显示设备(UHDTV、平板、智能手机、智能手表)相结合,为视频流带来更多应用场景,比如交互式平移和缩放功能等。不过,由于接入网络和家庭宽带的带宽限制,在现有网络上传输高分辨率视频会引起不少问题。此外,受限于显示设备的硬件能力,其解码器通常难以应对超高分辨率视频流。将视频内容按空间划分为子模块并传输至显示设备,再结合MPEG-DASH原生支持的多码率流,可以解决以上两个难点。这种方式对带宽要求较低,使得视频流子模块在网络上传输成为可能。
本文档简要概述了MPEG-DASH标准23009-1:2014第一部分第二次修订版中的空间表示描述(Spatial Representation Description, SRD)功能。该功能扩展了MPD文件,用于描述相关联的视频内容之间的空间关系。这使得DASH客户端可以只检索和下载那些切实保证用户体验的视频流。
二、使用场景
如图一,体育赛事中的缩放功能是SRD的一个简单使用场景。该场景下会存在两个视频。如图一所示,第一个是全高清的全景视频,另一个则是以全高清分辨率编码的该场景中心位置的局部放大视频。图一中上半部分图片上的网格表示可用来描述两个视频间空间关系的坐标系。
三、视频之间的空间关系
SRD功能提出的空间关系,可以让一个视频呈现另一个全画幅视频的某一空间部位。所述空间部位可以是根据感兴趣的位置和大小来展现的一个区块。这给客户端的自适应功能提供了额外的选项。支持SRD功能的DASH客户端可以使用SRD注解来挑选全画幅画面、或该画面的一部分,用于更好地保证其播放需求。通过避免对全画幅画面进行下载、解码和裁剪,可以有效地减少带宽占用和客户端计算负载。当使用相同分辨率传输某全画幅画面的一个空间部位并进行缩放时,又可以增加该部位的画面质量。
空间关系可以使用MPD文件中的DASH通用描述符来标识,给出某空间表示(即一个缩放视频)左上角位置的X和Y坐标、宽高、其所属的画面(即完整的视频)宽高。相关细节在23009-1:2014第二修订版的5.8.5.7中进行了详细描述。
四、总结
空间表示描述(SRD)是MPEG-DASH的新功能。它可以在适应流媒体传输中带宽和显示设备的局限性时,灵活地平移和缩放视频流。
五、引用
- [1] MPEG DASH, “Part 1: Media presentation description and segment formats / Amendment 2: Spatial Relationship Description, Generalized URL parameters and other extensions”, draft specification ISO-IEC_23009-1_A2_(E), 2015.
- [2] MPEG DASH, “Part 3: Implementation Guidelines / AMD1: Alignment with ISO/IEC 23009-1:2014 and extensibility”, ISO-IEC_TR_23009-3_A1_(E), 2015.
- [3] FP7 FascinatE project, videos, www.fascinate-project.eu/index.php/g…
- [4] EXPERIMEDIA FP7 project, www.experimedia.eu/2014/02/20/…
- [5] Judith A. Redi, Lucia D’Acunto, Omar Niamut, “Interactive UHDTV at the Commonwealth Games – An Explorative Evaluation”, TVX 2015, Brussels, tvx2015.com/program/ful…