Google Speech to Text 域适配

如何解决Google Speech to Text 域适配

我正在尝试对文本数据进行域适应，以改进 Google Cloud Speech-to-Text 的语音转文本结果。我已经使用 Azure 和 AWS 语音转文本系统完成了这项工作。在那里，您只需将包含领域特定语言的庞大文本语料库扔给系统，然后通常会获得更好的结果。

对于 Google 语音到文本系统，我还没有找到类似的东西。我发现的是这个教程：https://cloud.google.com/speech-to-text/docs/speech-adaptation
遗憾的是，这仅允许非常具体的改编（手动添加应该更好识别的单词）。
我曾尝试对我的文本语料库进行关键字提取并将提取的单词放入 speech_contexts[{"phrases": []}] 参数中，但这并没有改变我的结果。

有没有什么方法可以训练 Google 语音到文本服务（语言模型），并具有用于领域自适应的大型文本语料库？