从iOS应用程序中的音频文件中分离出语音和音乐(制作卡拉OK)

问题描述:

我正在研究音乐应用程序,并希望添加应用程序可以将歌曲转换为卡拉OK的功能。我正在学习CoreAudio框架。有没有办法处理它。 任何与其相关的链接或资源?从iOS应用程序中的音频文件中分离出语音和音乐(制作卡拉OK)

一般来说,分离乐器和人声不能通过滤波来完成,因为人声和乐器的音频频谱范围重叠很多。

对于立体声音乐,其主要声乐旋转死中心,并且器乐音乐在一侧或另一侧被平移,可以通过从另一侧减去一个声道来去除混音中的一些声音(比如说左边从右边)。要进行这种减法,您必须将mp3转换为原始PCM样本的未压缩音频,并使用C数据类型。

关于如何实现这一目标的学术研究的搜索术语是“盲源分离”。

没有那么多的“算法”作为“技巧”,但它可以在代码中自动化。它主要用于以人声为中心的立体声音轨。如果人声集中,他们在两个轨道上表现平等。如果您反转其中一首曲目,然后将它们合并到一起,则中心声乐的波形将被抵消并被虚拟删除。您可以使用大多数优秀的音频编辑器(如大胆)手动执行此操作。它不会给你完美的结果,而其余的音频也会受到一点影响,但它会带来很棒的卡拉OK曲目。

+0

这就像试图在混合器中搅拌后将所有单个食物成分拉出。 – jaybers