Tag: 音素

iOS / C:检测音素的algorithm

我正在寻找一种algorithm来确定实时audioinput是否与144个给定的(和舒适的不同的)音素对之一相匹配。 最好是做这项工作的最低级别。 我正在开发用于iPhone / iPad的激进/实验音乐培训软件。 我的音乐系统包括12个辅音音素和12个元音音素, 在这里演示。 这使得144个可能的音素对。 学生必须响应视觉刺激,唱出正确的音素“laa duu bee”等。 我已经做了大量的研究,看起来我最好的select可能是使用iOS Sphinx封装( iPhone App> Add voice recognition?是我find的最好的信息来源)。 然而,我看不出我将如何适应这样一个包,有经验的人使用这些技术之一是否会给出一个基本的步骤所需的概要? 用户需要培训吗? 我想不会,因为它是这样一个基本的任务,相比之下,与数千个单词和更大,更微妙的音素基地的全语言模型。 然而,让用户训练12个音素对是可以接受的(不理想的):{辅音1 +元音1,辅音2 +元音2,…,辅音12 +元音12}。 满144会太麻烦。 有一个更简单的方法吗? 我觉得使用全function的连续语音识别器是使用大锤来破解一个坚果。 使用能够解决问题的最低限度的技术将会更加优雅。 所以真的我正在寻找任何识别音素的开源软件。 PS我需要一个运行非常实时的解决scheme。 所以即使他们正在唱着这个音符,它也会先闪烁,说明它拿起了被唱过的音位,然后发光,以说明他们是否正在唱出正确的音符音调