WebRTC实战 | 视频云

最新推荐文章于 2025-09-16 11:36:10 发布

原创

最新推荐文章于 2025-09-16 11:36:10 发布 · 1.3k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#webrtc #音视频 #ffmpeg

本文深入探讨WebRTC技术，包括MediaStream API和RTCPeerConnection API的使用，涵盖音视频设备检测、采集、编码、传输及显示等环节。通过示例介绍如何创建和管理媒体流，调整视频质量，并讨论兼容性和屏幕共享等问题。

前言

WebRTC是当前实时通信领域的重要技术之一，具有广泛的应用前景。可以实现音频、视频和数据的实时传输。支持点对点通信、多方会议、屏幕共享等多种应用场景，同时具有高质量、低延迟、强安全性等特点，是开发实时通信应用的理想选择。可以应用于远程协作、在线教育、在线医疗、物联网等领域，具有广泛的商业应用前景。WebRTC技术包括了音视频的采集、编解码、网络传输、显示等功能，本文主要从API使用说明和注意细节方面介绍一下WebRTC的大致情况。

根据W3C的WebRTC1.0:Real-time Communication Between Browsers规范，WebRTC的源码中定义了两套主要的C++接口，分别是MediaStream与PeerConnection相关的API，MediaStream 相关API定义在源码api\media_stream_interface.h中。主要涉及这4个概念：source、sink、meidatrack、mediastream。

MediaStream API

MediaAPI中有两个重要组成：MediaStreamTrack、MediaStream。MediaStreamTrack对象代表单一类型的媒体流，产生自客户端的media source，可以是音频或者视频，但只能是其中一种，是音频称作audio track，视频的话称作video track，这其实就是我们平时所说的音轨与视频轨。

一个track由source与sink组成。source给track提供数据。

MeidiaStream用于将多个MediaStreamTrack对象打包到一起。一个MediaStream可包含audio track 与video track。类似我们平时的多媒体文件，可包含音频与视频。

一个MediaStream对象包含0或多个MediaStreamTrack对象。MediaStream中的所有MediaStreamTrack对象在渲染时必须同步。就像我们平时播放媒体文件时，音视频的同步。

简单点说，source 与sink构成一个track，多个track构成MediaStram。

source 与 sink

在MediaTrack的源码中，MediaTrack都是由对应的source和sink组成的。

浏览器中存在从source到sink的媒体管道，其中source负责生产媒体资源，包括多媒体文件，web资源等静态资源以及麦克风采集的音频，摄像头采集的视频等动态资源。而sink则负责消费source生产媒体资源，也就是通过，video等媒体标签进行展示，或者是通过RTCPeerConnection将source通过网络传递到远端。RTCPeerConnection可同时扮演source与sink的角色，作为sink，可以将获取的source降低码率，缩放，调整帧率等，然后传递到远端，作为source，将获取的远端码流传递到本地渲染。