使用SAPI5使用文本到语音时,是否可以扩大口语之间的差距?
问题是,尤其是有些声音,这些词几乎相互联系,这使得演讲更难以理解.
我正在使用python和pyTTS模块(在Windows上,因为它使用的是SAPI)
我试图挂钩OnWord事件并添加time.sleep()或tts.Pause(),但显然即使所有事件都被捕获,它们只在语音文本的末尾处理,不管我是不是使用sync或async标志.
在这个非工作示例中,只有在说出句子后才执行sleep()方法:
tts = pyTTS.Create()
def f(x):
tts.Pause()
sleep(0.5)
tts.Resume()
tts.OnWord = f
tts.Speak(text)
编辑: – 接受的解决方案
我的实际答案要么是
>用自己的“说话”命令说出每个单词,(由@Lennart Regebro建议),或者
>用逗号替换每个空格(如@Dawson所述),例如:
text = text.replace(“”,“,”)
这设置了一个合理的停顿.我之前没有提到Pause方法,因为’我对接受的解决方案感到满意.
解决方法:
你在谈论语音速率,对吧?
http://msdn.microsoft.com/en-us/library/ms990078.aspx
暂停()我相信,在正常的语音模式中,它的作用很像逗号…除了你确定长度(自然与否).