speech-to-text - 编程之家

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

speech-to-textspeech-to-text专题提供speech-to-text的最新资讯内容，帮你更好的了解speech-to-text。

用于医学词汇的预训练 Quartznet ASR 模型的微调

我无法在这方面找到可行的资源，我很清楚这个平台是用于解决错误和调试的，但是如果有人以前使用

作者：佚名时间：2022-11-24

使用 Google Cloud 语音转文本仅转录音频的特定部分

我似乎在文档中找不到任何说明。我能够从 Google Cloud 存储成功转录音频，但它转录了整个文件。为了节

作者：佚名时间：2022-11-22

SpaCy，如何创建一个模式来匹配通过 SpeechRecognition 捕获的字符串？

第一次来这里求助，希望一切都清楚！事实：我正在为角色扮演游戏 (GURPS) 构建一个应用程序，它跟踪

作者：佚名时间：2022-11-21

如何正确生成小词汇量的 Deepspeech 评分器文件？

我正在尝试为特定词汇制作 STT 引擎。我的词汇由国家名称和一些动作句子组成。尝试生成 lm.binary 和 voc

作者：佚名时间：2022-11-20

线程目标函数未完成

我在循环中的某个点创建了一个线程，但它不会再次创建该线程，因为该线程的目标尚未完成。我正在

作者：佚名时间：2022-11-20

使用 Speech 框架和 contextualStrings

所以我正在尝试使用 iOS 中的 Speech 框架检测 Speech-to-text 中的不流畅/填充词。默认情况下，SFSpeechA

作者：佚名时间：2022-11-18

是否有一个很好的开源选项来使用用户特定的自定义词汇表将语音转文本流式传输？

我正在构建一个严重依赖实时语音到文本转录的 SaaS 产品。一个重要的方面是每个用户都需要能够识别

作者：佚名时间：2022-11-14

如何从 SpeechRecognition 进行 Python 自动语言检测

Python 需要在用户点击 Transcribe 按钮时自动识别正在加载的音频文件的语言并以特定语言打印音频文件中

作者：佚名时间：2022-10-31

如何使用创建自定义类来格式化 Google Speech-to-Text api 中的电话号码？

我使用 Google Speech-to-Text api 以<strong>希伯来语</strong>转录电话。大多数电话都包含告诉他们电话号

作者：佚名时间：2022-10-26

Microsoft 语音到文本无法识别除英语之外的其他语言

我正在使用微软语音转文本服务。我的要求是识别和转换麦克风上的任何口语应转换为文本。例如，如

作者：佚名时间：2022-10-22

运行此 python 脚本以导入语音到文本模型时遇到运行时错误

<pre><code>import nemo import ffmpeg import nemo.collections.asr as nemo_asr model = nemo_asr.models.EncDecCTCModel.from_pretrained(model_na

作者：佚名时间：2022-10-19

在音频文件语音到文本 microsoft sdk

我正在使用 Speech-To-Text Microsoft SDK for Javascript 创建 VTT 文件。 <code>SpeechRecognizer</code> 类有一个名为 <code>r

作者：佚名时间：2022-04-17

浏览器应用程序中 JavaScript SDK 中的 Microsoft Azure 语音到文本行为

我已在浏览器应用程序中的 JavaScript SDK 中将 Azure 语音部署到文本 SDK。在以下场景中发现困难。 <ol> <

作者：佚名时间：2022-08-26

如何使用 IBM Speech to Text 进行说话人分类？

我正在尝试使用 IBM 语音到文本执行说话者分类。我正在通过 API 发送我的音频文件，并且得到的结果为

作者：佚名时间：2022-08-26

如果 Google 决定停止 SpeechRecognizer 或限制它，如何基于 SpeechRecognizer 评估应用程序的用户/卖家关系

我基于 <strong>SpeechRecognizer</strong> <a href="https://developer.android.com/reference/android/speech/SpeechRecognizer" rel="nofoll

作者：佚名时间：2022-09-19

有没有办法一次将多个视频文件转录成文本？

我可以将一个视频文件转录为文本，但我想一次转录多个视频文件以提高效率。我使用以下代码转录了

作者：佚名时间：2022-09-08

哪个 API 是最好的开源，可以将语音翻译成音标？

现在我正在考虑将语音翻译成音标。但是，虽然我可以找到可以将脚本翻译成音标的软件，但我找不到

作者：佚名时间：2022-09-06

如何加快 Wav2vec 2.0 模型性能并将此模型部署到生产中？

我在我的数据库上微调了 Wav2vec 模型，我们想在生产中部署它，由于这个模型的高参数（317M）和语音到

作者：佚名时间：2022-09-06

当我尝试调用语音识别器时应用程序崩溃

不确定为什么我的应用崩溃了？大约一年前它曾经可以工作，但现在同样的代码崩溃了。当时我正在手

作者：佚名时间：2022-07-13

错误：文件在 Colab 上不以 RIFF id 开头

我正在尝试在 colab 中录制音频并使用语音识别模块将其转换为文本。我用这个 <a href="https://stackoverflow.co

作者：佚名时间：2022-07-07

上一页 8 9 10 11 12 13 141516 下一页

小编推荐

苹果市值2025年有望达4万亿美元