音频转码 via Media Foundation
转码(transcoding)其实就是把音频从一种编码转换成另一种编码的过程,如 MP3 → WMA。基本流程如下图:

Media Foundation 简介
Media Foundation (简称 MF)是微软在 Windows Vista上 推出的新一代多媒体应用库,目的是提供 Windows 平台一个统一的多媒体影音解决方案,开发者可以通过 MF 播放视频或声音文件、进行多媒体文件格式转码,或者将一连串图片编码为视频等等。
MF 是 DirectShow 为主的旧式多媒体应用程序接口的替代者与继承者,在微软的计划下将逐步汰换 DirectShow 技术。MF 要求 Windows Vista 或更高版本,不支持较早期的 Windows 版本,特别是 Windows XP。
MF 长于高质量的音频和视频播放,高清内容(如 HDTV,高清电视)和数字版权管理(DRM)访问控制。MF 在不同的 Windows 版本上能力不同,如 Windows 7 上就添加了 h.264 编码支持。Windows 8 上则提供数种更高质量的设置。
MF 提供了两种编程模型,第一种是以 Media Session 为主的 Media pipeline 模型,但是该模型太过复杂,且曝露过多底层细节,故微软于 Windows 7 上推出第二种编程模型,内含 SourceReader、Transcode API 、SinkWriter 及 MFPlay 等高度封装模块,大大简化了 MF 的使用难度。
# 本文使用了第二种(简单的)编程模型。
Media Foundation 转码音频
Transcoding 流程图

Transcoding 代码
以下是整个 MF 转码过程的概要代码,略去 TopoBuilder 类的实现:
HRESULT CTranscodeApi::transcodeFile(PCWSTR pszInput, PCWSTR pszOutput)
{
HRESULT hr = S_OK;
CComPtr<IMFTopology> pTopology;
hr = MFCreateMediaSession(NULL, &m_pSession);
RETURN_IF_FAILED(hr);
hr = m_pSession->BeginGetEvent((IMFAsyncCallback*)this, NULL);
RETURN_IF_FAILED(hr);
hr = _setTranscodeProfile(pszOutput);
RETURN_IF_FAILED(hr);
hr = m_topoBuilder.createTranscodeTopology(pszInput, pszOutput);
RETURN_IF_FAILED(hr);
pTopology = m_topoBuilder.getTopology();
hr = m_pSession->SetTopology(0, pTopology);
if (SUCCEEDED(hr)) {
PROPVARIANT varStart;
PropVariantClear(

最低0.47元/天 解锁文章
2310

被折叠的 条评论
为什么被折叠?



