我曾经有过这样一种场景:用户用表演者的实时音频捕获音乐会现场,同时设备正在从音频广播设备下载实时流。后来我用一个i代替了实时嘈杂的音频(在录制时捕获)已流式传输并保存在我的手机中(高质量音频)。现在,我在合并时根据试错法手动设置音频偏移,以便可以在精确位置同步音频和视频事件。

现在我要做的是自动化音频同步过程,而不是在给定的偏移量下将视频与清晰的音频合并,我想通过适当的同步自动将视频与清晰的音频合并。

为此,我需要找到我应该用清晰的音频替换嘈杂的音频的偏移量。当用户开始录制并停止录制时,我将获取实时音频的样本并与实时流式音频进行比较,并从中获取该音频的确切部分并在理想时间进行同步。

有谁知道如何通过比较两个音频文件并与视频同步来找到偏移量?

最佳答案

这是一个简洁明了的答案。

•这并不容易-它将涉及信号处理和数学运算。
•快速的Google给我this解决方案,包括代码。
•有关上述技术here的更多信息。
•建议您至少要有一个基本的了解,然后再尝试将其移植到iOS。
•建议您在iOS上使用Accelerate框架进行快速傅立叶变换等
•我不同意在服务器上执行此操作的其他答案-如今,设备功能强大。用户不介意花费几秒钟的时间处理看似不可思议的事情。

09-13 12:43