如何解决AWS Polly SSML标记与音频不匹配
我需要合并两个短语。一种常见,另一种-带有玩家的名字。
常用短语如下:
<speak>
Come on,<mark name="start_playername"/>PlayerName<mark name="end_playername"/>,you
</speak>
当我要求标记该短语时,我得到了:
[
{
"time": 555,"type": "ssml","start": 16,"end": 47,"value": "start_playername"
},{
"time": 1005,"start": 57,"end": 86,"value": "end_playername"
}
]
计划是在每个“ start_playername”标记处暂停主要声音,播放播放器名称的声音,然后从最近的“ end_playername”标记处继续播放主要声音。
标记与音频不匹配,结果非常难看。标记不会像预期的那样切断整个单词 PlayerName 。取而代之的是仅剪切 Pla ,并保留 erName 。
我在Audacity中重新组合了这种情况以展示问题:
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。