最简单的测量两个短audio的相似度的algorithm

问题是要寻找任何开源或简单的实现来衡量iOS应用程序之间的两个audio之间有多么相似。

简而言之,audio可以用一维vector来表示,来计算一维vector之间的距离。 但audio长度会有所不同,因此需要一些预处理等。

期待在这里得到一些线索,谢谢

用DTW可以有效地计算两个变长序列之间的相似性:

http://en.wikipedia.org/wiki/Dynamic_time_warping

这个algorithm很容易实现,并且有很多现有的实现链接在wiki页面上。

简而言之,audio可以用一维向量表示,

将audio分成帧并将其转换为特征的二维vector是合理的,其中对于每一帧,您都有对应于不同频带的值(特征)arrays。 如果你想处理音乐,每帧的FFT是一个好主意,对于语音,最好是计算梅尔频率倒谱

再次,您可以使用许多现有的库来获取mel频率特征,其中一个是语音识别工具包CMUSphinx