1. 多媒体信息
1.1 多媒体信息的两个主要特点:
- 信息量很大
- 标准语音:64Kbits(8KHz采样,8位编码)
- 高质量音频:3Mbps(100KHz采样,12位编码)
- 在传输多媒体数据时,对时延和时延抖动均有较高要求
1.2 处理时延抖动:
缓存的方式在一定程度上消除了时延抖动,但是增加了时延,因为推迟播放了。
1.3 需要注意的问题
- 在传送时延敏的实时数据时,不仅传输时延不能大,时延抖动也必须限制
- 传送实时数据时,少量分组的丢失是可以容忍的
- 丢失容忍是实时数据的另一个重要特点。
- 发送多媒体数据时应当加一个序号,以按序还原和播放
- 增加一个时间戳,告诉接收端分组的产生时间。比如音频要和字母顺序对应上。
1.4 必须改造现有的互联网
- 大量使用高速路由器和光缆
- 完全改造现有协议,为端到端带宽预留,把无连接协议的互联网转变为面向连接的网络
- 少量改造现有协议,使得能适配这种数据传输
2. 流式存储音频、视频
存储音频/视频不是实时产生的,而是已经录制好的,通常存储在硬盘中。
第一种方式:
第二种方式:元文件
第三种方式:媒体服务器
2.1 下载时使用何种协议
采用UDP的缺点:
- 网络情况多变,接收端很难始终按照规定的速率播放
- 很多单位的防火墙往往阻拦外部UDP分组的进入
- 使用UDP传送流媒体时,如果用户希望控制媒体的播放,暂停、快进等,还需要单独的RTP和RTSP协议
采用TCP的场景
现在,对流式存储音频/视频的播放,如YouTube都是采用TCP来传送。
采用UDP的场景:
如果是实时观看实况转播,应当首先考虑采用UDP来传送。
2.2 实时流式协议RTSP
实时流式协议RTSP(Real-Time Streaming Protocol)
- 应用层的多媒体播放控制协议,不传送数据
- 以客户服务器方式工作
- 使用户能对从互联网下载的实时数据进行控制,如暂停,快进,跳跃
- 又称为互联网录像机遥控协议
- RTSP 是有状态的协议,它记录客户机所处的状态(初始状态,播放状态)
- RTSP控制分组可在TCP上传送,也可在UDP上传送
3. 交互式音视频
3.1 实时传输协议RTP
- 实时传输协议RTP(RealTime-Transmission-Protocol)为实时应用提供端到端的运输,但不提供任何服务质量的保证。
- RTP不对音视频数据做任何处理,只是向应用层提供一些附加信息,让应用层知道应当如何处理。
- 音视频数据块先由RTP封装为RTP分组(也称为RTP报文),再装入传输层的UDP用户数据报后,再向下递交给IP层。
- RTP端口号1025-65535之间选择一个未使用的偶数端口,同一次会话的RTCP则使用下一个奇数UDP端口号。但端口号5004和5005则分别用作RTP和RTCP的默认端口号。
3.2 RTP使用场景
3.2.1 多播音频会议
使用Internet的IP多播服务来进行语音通讯。通过一些分配机制,工作组主持人获得一个多播的组地址和一对端口。一个端口用于音频数据,另一个端口用于控制(RTCP)数据包。该地址和端口信息发布给预定的参与者。
每个与会者所使用的音频会议应用程序,都以small chunk形式(比方说20毫秒一段)来发送音频数据。每个音频数据块都前缀RTP报头;RTP报头和数据然后包含在UDP包中。RTP报头指明了各个包里音频编码的类型(如PCM, ADPCM,LPC),这样发送方可以在会议过程中改变编码格式,例如,为了要适应一个低带宽的参与者,或是要应付网络拥塞。
Internet,偶而会丢包和重排包。为应付这种损伤,RTP报头里包