微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Android 上的实时电话通话字幕/转录语音到文本

如何解决Android 上的实时电话通话字幕/转录语音到文本

这个问题是为了帮助“重听社区”,让他们可以阅读电话/移动电话,因为他们听不到。

Android 11 提供了一个 API“AudioPlaybackCaptureConfiguration”。此 API 使应用能够复制其他应用正在播放的音频。

Google 还在 Pixel 手机上实现了相同的功能,如下所示 - https://www.youtube.com/watch?v=7hb3p8LZIq8 。但它几乎没有限制 -

  1. 它只支持英语,如何启用对区域语言的支持
  2. 当前的实现使用本地移动引擎将语音转换为文本,即语音不会发送到谷歌服务器(所有处理都在移动设备本身离线进行),因此准确性也很低。

在这里看到很多帖子后,似乎开发人员在实现相同的功能以捕获来电者的声音然后由于 Google 的某些限制对其进行转录时遇到了问题。

How to record internal audio on Android devices or record MediaPlayer Audio Stream?

无论如何要捕捉来电者的声音 (https://developer.android.com/guide/topics/media/playback-capture#allowing_playback_capture) 吗?就像我上面分享的 youtube 视频一样,谷歌必须捕捉来电者的声音,其离线引擎正在处理该声音并将其转换为文本。那么我们是否可以使用某种方式捕获来电者的声音,然后将该声音发送到某个服务器 API 或 Google Live Transcribe 应用程序(或其他任何应用程序)以获得更高的准确性,然后转换后的文本将显示在屏幕上(根据用户选择语言)。

我也是一名开发人员,但不是移动开发人员。所以有些术语可能是错误的,请原谅并提供您的建议。

我们是否可以根据我们的要求修改 Android 源代码本身并消除该限制,以便即使需要构建自定义 Android 操作系统,我们也可以实现我们想要做的事情?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。