Tag: 语音

TTS：适用于iOS的Ivona SDK – Project中的禁止将应用程序增加到200MB +: 我目前正在试用ivona SDK for iOS，令人惊叹的声音，非常自然。但是，我使用的语音（德语为女性）有一个230 MB的文件大小的语音文件。当我想使用4个声音，那么我的应用程序大约是1GB 。也离线不用。这个声音只是为了testing阶段吗？或者它也用于生产？我觉得可怕的是为一个小的TTS应用程序实现一些声音，以便应用程序的大小非常巨大。有人可以给我一个答案吗？

如何用SSML减慢文本到语音 – 语音听起来失真/变形/可怕: 我正在使用细微的龙手机sdk为iPhone，使用文字发言。被阅读的文本有点快，我想让它慢一点，所以用户可以学习这些单词。我的目标是放慢文本。这对于SSML和韵律标签来说非常好，请参阅以下代码： <prosody rate="slow">This is the text which is spoken slow, but the voice sounds distorted/warped/ghastly</prosody> 声音听起来扭曲，扭曲和可怕。你明白我的意思吗？我能做些什么来获得一个清晰的声音，但慢文字说话？

比较audio文件的“语音身份validation”: 我正在开发一个iPhone应用程序。此应用程序用于存储用户的个人数据。为了安全起见，我们希望在应用程序中提供新的function，用户可以在login到应用程序后访问数据。问题是我们需要提供“语音authentication” 。意思是说，用户可以通过logging来保存“hi”这个词作为他的密码。如果他需要login我们的应用程序，他应该说“嗨”一词。然后将这两个声音进行比较，如果它们匹配，则用户将被authentication并允许login。这样的应用程序是可能的吗？可以比较Iphone中的声音吗？我研究了这些链接，但没有得到一个想法。请帮帮我。 http://developer.apple.com/library/mac/#documentation/AVFoundation/Reference/AVAudioPlayerClassReference/Reference/Reference.html https://developer.apple.com/library/mac/#documentation/AVFoundation/Reference/AVAudioRecorder_ClassReference/Reference/Reference.html https://developer.apple.com/library/mac/#documentation/musicaudio/reference/CoreAudioDataTypesRef/Reference/reference.html

video播放后，语音文本sdk会冻结: 我正在使用由https://github.com/todoroo/iPhone-Speech-To-Text提供的speech-to-text sdk 识别器工作得很好，直到使用MPMoviePlayerController播放video为止。这里是我用来调用识别器的代码： – (IBAction)actionBtRecognition:(id)sender { if(recognizer == nil){ recognizer = [[SpeechToTextModule alloc] init]; } [recognizer beginRecording]; } 要播放电影，我使用了本教程所以，一旦我播放电影和呼叫识别器，它只是冻结。当我debuggingSDK源代码时，我发现我的声音不是录音。可变meterStateDB.mAveragePower总是= -120 请注意，在我的苹果iphone模拟器所有作品完美！但在真正的设备上（iphone 4，ios 5.1.1）发生了我上面描述的问题。也许这只是我的设备问题？如果有人在自己的设备上检查相同的东西，我将非常感激。