我目前正在试用ivona SDK for iOS,令人惊叹的声音,非常自然。 但是,我使用的语音(德语为女性)有一个230 MB的文件大小的语音文件。 当我想使用4个声音,那么我的应用程序大约是1GB 。 也离线不用。 这个声音只是为了testing阶段吗? 或者它也用于生产? 我觉得可怕的是为一个小的TTS应用程序实现一些声音,以便应用程序的大小非常巨大。 有人可以给我一个答案吗?
我正在使用细微的龙手机sdk为iPhone,使用文字发言。 被阅读的文本有点快,我想让它慢一点,所以用户可以学习这些单词。 我的目标是放慢文本。 这对于SSML和韵律标签来说非常好,请参阅以下代码: <prosody rate="slow">This is the text which is spoken slow, but the voice sounds distorted/warped/ghastly</prosody> 声音听起来扭曲,扭曲和可怕 。 你明白我的意思吗? 我能做些什么来获得一个清晰的声音,但慢文字 说话 ?
我正在开发一个iPhone应用程序。 此应用程序用于存储用户的个人数据。 为了安全起见,我们希望在应用程序中提供新的function,用户可以在login到应用程序后访问数据。 问题是我们需要提供“语音authentication” 。 意思是说,用户可以通过logging来保存“hi”这个词作为他的密码。 如果他需要login我们的应用程序,他应该说“嗨”一词。 然后将这两个声音进行比较,如果它们匹配,则用户将被authentication并允许login。 这样的应用程序是可能的吗? 可以比较Iphone中的声音吗? 我研究了这些链接,但没有得到一个想法。 请帮帮我。 http://developer.apple.com/library/mac/#documentation/AVFoundation/Reference/AVAudioPlayerClassReference/Reference/Reference.html https://developer.apple.com/library/mac/#documentation/AVFoundation/Reference/AVAudioRecorder_ClassReference/Reference/Reference.html https://developer.apple.com/library/mac/#documentation/musicaudio/reference/CoreAudioDataTypesRef/Reference/reference.html
我正在使用由https://github.com/todoroo/iPhone-Speech-To-Text提供的speech-to-text sdk 识别器工作得很好,直到使用MPMoviePlayerController播放video为止。 这里是我用来调用识别器的代码: – (IBAction)actionBtRecognition:(id)sender { if(recognizer == nil){ recognizer = [[SpeechToTextModule alloc] init]; } [recognizer beginRecording]; } 要播放电影,我使用了本教程 所以,一旦我播放电影和呼叫识别器,它只是冻结。 当我debuggingSDK源代码时,我发现我的声音不是录音。 可变meterStateDB.mAveragePower总是= -120 请注意,在我的苹果iphone模拟器所有作品完美! 但在真正的设备上(iphone 4,ios 5.1.1)发生了我上面描述的问题。 也许这只是我的设备问题? 如果有人在自己的设备上检查相同的东西,我将非常感激。