首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >不同的<prosody> ssml值在Google Text to Speech中生成相同的音频

不同的<prosody> ssml值在Google Text to Speech中生成相同的音频
EN

Stack Overflow用户
提问于 2019-04-30 17:49:41
回答 1查看 257关注 0票数 5

在使用WaveNet语音时使用ssml时,无法生成不同的音频波形。

代码语言:javascript
复制
<prosody rate="slow" pitch="-2st">Can you hear me now?</prosody>
<prosody rate="medium" pitch="1st">Can you hear me now?</prosody>
<prosody rate="high" pitch="5st">Can you hear me now?</prosody>

使用emphasis标签会产生相同的结果。

我们使用来自Google Cloud Text- to -Speech的Python API来请求音频生成。

我想在每个样本中听到不同的声音强度。

请注意,我们也尝试美化",但它对生成的音频没有任何影响。

https://issuetracker.google.com/issues/131618213

EN

回答 1

Stack Overflow用户

发布于 2020-08-25 03:10:22

我不知道Python sdk是什么样子的,但我目前正在使用他们的NodeJs sdk for TTS。

看起来,这些韵律属性(速率,音量,音高),而不是设置和传递你的ssml文本,应该直接在请求对象中配置,该对象将被发送到Google TTS api。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55918292

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档