Android音视频开发：录制视频 + 语音识别 + 人脸识别

置顶

吴庆森

于 2020-01-06 15:44:36 发布

阅读量3.4k

点赞数 5

分类专栏： Android音视频开发

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wuqingsen1/article/details/103799520

版权

最近两个月在搞 Android 音视频相关方面的需求，下面是记录一次音视频开发的实操记录；

最下面有demo；

移动端具体的需求是这个样子的：

录制视频 + 同时语音识别 + 同时人脸识别 + 同时语音合成；视频时长大概是一个小时，不能压缩处理。

OK，需求出来我是崩溃的，Android 原生不支持录制视频的同时去实现语音识别，而 iOS 原生支持，这就加长了 Android 开发周期；其次 Android 麦克风不支持同时两个音频源同时输入音频，也就是说要使用 MediaCodec (编解码器) 和 MediaFormat ；这对于九窍已通八窍的我着实有点难度；

认真分析之后给出了下面几种方案：

方案一：

开一个线程使用 AudioRecord 录制音频流，将音频流拿去解析实现语音识别同时使用 MediaCodec 编码成 AAC 音频格式文件；

另一个线程使用 Camera 录制视频流，拿到视频流去实现人脸识别同时使用 MediaCodec 编码成 H264 格式视频流文件；

最后将 AAC 与 H264 合成为 MP4 格式视频文件；

方案二：

开一个线程使用 AudioRecord 录制音频流，将音频流拿去解析实现语音识别同时使用 MediaCodec 编码成 AAC 音频格式文件；

另一个线程使用 Camera 录制视频流，拿到视频流去实现人脸识别同时使用 MediaCodec 编码成 H264 格式视频流文件；

第三个线程为混合线程，将音视频流分别添加音视频轨道ÿ

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。