从iOS应用程序中的音频文件中分离出语音和音乐（制作卡拉OK）

问题描述：

我正在研究音乐应用程序，并希望添加应用程序可以将歌曲转换为卡拉OK的功能。我正在学习CoreAudio框架。有没有办法处理它。任何与其相关的链接或资源？从iOS应用程序中的音频文件中分离出语音和音乐（制作卡拉OK）

答

一般来说，分离乐器和人声不能通过滤波来完成，因为人声和乐器的音频频谱范围重叠很多。

对于立体声音乐，其主要声乐旋转死中心，并且器乐音乐在一侧或另一侧被平移，可以通过从另一侧减去一个声道来去除混音中的一些声音（比如说左边从右边）。要进行这种减法，您必须将mp3转换为原始PCM样本的未压缩音频，并使用C数据类型。

关于如何实现这一目标的学术研究的搜索术语是“盲源分离”。

没有那么多的“算法”作为“技巧”，但它可以在代码中自动化。它主要用于以人声为中心的立体声音轨。如果人声集中，他们在两个轨道上表现平等。如果您反转其中一首曲目，然后将它们合并到一起，则中心声乐的波形将被抵消并被虚拟删除。您可以使用大多数优秀的音频编辑器（如大胆）手动执行此操作。它不会给你完美的结果，而其余的音频也会受到一点影响，但它会带来很棒的卡拉OK曲目。

这就像试图在混合器中搅拌后将所有单个食物成分拉出。 – jaybers

从iOS应用程序中的音频文件中分离出语音和音乐（制作卡拉OK）

相关推荐