在iOS中同时pipe理文本到语音和语音识别

我希望我的iOS应用程序使用文本到语音向用户读取从服务器接收的一些信息，并且还希望允许用户通过语音命令来停止这种语音。我已经尝试过iOS的语音识别框架，比如OpenEars ，我发现它正在侦听和检测应用程序本身是“说”的信息，并干扰了用户语音命令的识别。

有人在iOS处理这种情况，并find了解决scheme吗？提前致谢

这并不是一件微不足道的事情。不幸的是，iOS和其他人logging了通过扬声器播放的声音。您唯一的select是使用耳机。在这种情况下，语音识别可以继续监听input。在TTS期间，除非耳机插入，否则在Openers中识别被禁用。

如果你仍然想要实现这个被称为“插入”的function，你必须做到以下几点：

通过麦克风存储您播放的audio
执行噪音消除algorithm，有效地将录音中的audio去除。您可以使用互相关在录音和频谱相减中find适当的偏移量以消除audio。
识别剩余信号中的语音。

如果没有对开放源代码进行重大修改，这是不可能的。

相关的问题是音乐播放时的Android语音识别

Interesting Posts

是否可以在iOS中使用TTS？

如何在应用程序中使用iOS的内置文本语音function？

AVSpeechSynthesizer文字转语音

如果在设备的Accessiblity设置中未启用SpeakSelection，则对于文本到语音使用AVSpeechSynthesizer / AVSpeechUtterance将不起作用

如何用SSML减慢文本到语音 – 语音听起来失真/变形/可怕

为什么我要在iOS设备testing中获得“为Mac资源build立MacinTalk语音：（null）”

iOS是否提供了内置的文本语音支持或任何类如NSSpeechRecognizer？

TTS：适用于iOS的Ivona SDK – Project中的禁止将应用程序增加到200MB +

文本到语音转换