微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Google Speech to Text 域适配

如何解决Google Speech to Text 域适配

我正在尝试对文本数据进行域适应,以改进 Google Cloud Speech-to-Text 的语音转文本结果。 我已经使用 Azure 和 AWS 语音转文本系统完成了这项工作。在那里,您只需将包含领域特定语言的庞大文本语料库扔给系统,然后通常会获得更好的结果。

对于 Google 语音到文本系统,我还没有找到类似的东西。我发现的是这个教程:https://cloud.google.com/speech-to-text/docs/speech-adaptation
遗憾的是,这仅允许非常具体的改编(手动添加应该更好识别的单词)。
我曾尝试对我的文本语料库进行关键字提取并将提取的单词放入 speech_contexts[{"phrases": []}] 参数中,但这并没有改变我的结果。

有没有什么方法可以训练 Google 语音到文本服务(语言模型),并具有用于领域自适应的大型文本语料库?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。