手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
人工智能
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
网络运维
技术频道
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
speech-to-text
speech-to-text专题提供speech-to-text的最新资讯内容,帮你更好的了解speech-to-text。
用于医学词汇的预训练 Quartznet ASR 模型的微调
我无法在这方面找到可行的资源,我很清楚这个平台是用于解决错误和调试的,但是如果有人以前使用
作者:佚名 时间:2022-11-24
使用 Google Cloud 语音转文本仅转录音频的特定部分
我似乎在文档中找不到任何说明。我能够从 Google Cloud 存储成功转录音频,但它转录了整个文件。为了节
作者:佚名 时间:2022-11-22
SpaCy,如何创建一个模式来匹配通过 SpeechRecognition 捕获的字符串?
第一次来这里求助,希望一切都清楚! 事实: 我正在为角色扮演游戏 (GURPS) 构建一个应用程序,它跟踪
作者:佚名 时间:2022-11-21
如何正确生成小词汇量的 Deepspeech 评分器文件?
我正在尝试为特定词汇制作 STT 引擎。我的词汇由国家名称和一些动作句子组成。尝试生成 lm.binary 和 voc
作者:佚名 时间:2022-11-20
线程目标函数未完成
我在循环中的某个点创建了一个线程,但它不会再次创建该线程,因为该线程的目标尚未完成。我正在
作者:佚名 时间:2022-11-20
使用 Speech 框架和 contextualStrings
所以我正在尝试使用 iOS 中的 Speech 框架检测 Speech-to-text 中的不流畅/填充词。 默认情况下,SFSpeechA
作者:佚名 时间:2022-11-18
是否有一个很好的开源选项来使用用户特定的自定义词汇表将语音转文本流式传输?
我正在构建一个严重依赖实时语音到文本转录的 SaaS 产品。一个重要的方面是每个用户都需要能够识别
作者:佚名 时间:2022-11-14
如何从 SpeechRecognition 进行 Python 自动语言检测
Python 需要在用户点击 Transcribe 按钮时自动识别正在加载的音频文件的语言并以特定语言打印音频文件中
作者:佚名 时间:2022-10-31
如何使用创建自定义类来格式化 Google Speech-to-Text api 中的电话号码?
我使用 Google Speech-to-Text api 以<strong>希伯来语</strong>转录电话。 大多数电话都包含告诉他们电话号
作者:佚名 时间:2022-10-26
Microsoft 语音到文本无法识别除英语之外的其他语言
我正在使用微软语音转文本服务。我的要求是识别和转换麦克风上的任何口语应转换为文本。例如,如
作者:佚名 时间:2022-10-22
运行此 python 脚本以导入语音到文本模型时遇到运行时错误
<pre><code>import nemo import ffmpeg import nemo.collections.asr as nemo_asr model = nemo_asr.models.EncDecCTCModel.from_pretrained(model_na
作者:佚名 时间:2022-10-19
在音频文件语音到文本 microsoft sdk
我正在使用 Speech-To-Text Microsoft SDK for Javascript 创建 VTT 文件。 <code>SpeechRecognizer</code> 类有一个名为 <code>r
作者:佚名 时间:2022-04-17
浏览器应用程序中 JavaScript SDK 中的 Microsoft Azure 语音到文本行为
我已在浏览器应用程序中的 JavaScript SDK 中将 Azure 语音部署到文本 SDK。在以下场景中发现困难。 <ol> <
作者:佚名 时间:2022-08-26
如何使用 IBM Speech to Text 进行说话人分类?
我正在尝试使用 IBM 语音到文本执行说话者分类。我正在通过 API 发送我的音频文件,并且得到的结果为
作者:佚名 时间:2022-08-26
如果 Google 决定停止 SpeechRecognizer 或限制它,如何基于 SpeechRecognizer 评估应用程序的用户/卖家关系
我基于 <strong>SpeechRecognizer</strong> <a href="https://developer.android.com/reference/android/speech/SpeechRecognizer" rel="nofoll
作者:佚名 时间:2022-09-19
有没有办法一次将多个视频文件转录成文本?
我可以将一个视频文件转录为文本,但我想一次转录多个视频文件以提高效率。我使用以下代码转录了
作者:佚名 时间:2022-09-08
哪个 API 是最好的开源,可以将语音翻译成音标?
现在我正在考虑将语音翻译成音标。但是,虽然我可以找到可以将脚本翻译成音标的软件,但我找不到
作者:佚名 时间:2022-09-06
如何加快 Wav2vec 2.0 模型性能并将此模型部署到生产中?
我在我的数据库上微调了 Wav2vec 模型,我们想在生产中部署它,由于这个模型的高参数(317M)和语音到
作者:佚名 时间:2022-09-06
当我尝试调用语音识别器时应用程序崩溃
不确定为什么我的应用崩溃了?大约一年前它曾经可以工作,但现在同样的代码崩溃了。当时我正在手
作者:佚名 时间:2022-07-13
错误:文件在 Colab 上不以 RIFF id 开头
我正在尝试在 colab 中录制音频并使用语音识别模块将其转换为文本。我用这个 <a href="https://stackoverflow.co
作者:佚名 时间:2022-07-07
上一页
8
9
10
11
12
13
14
15
16
下一页
小编推荐
苹果市值2025年有望达4万亿美元
• 联想拯救者新一代Y700平板通过IMDA认证
• 最新AI生图模型Flux1.1刷屏!添加单反相
• 联发科天玑 9400 频率敲定,3.626GHz 最
• 苹果新品发布会来了!5款产品面临停产
• 佳能R5C Mark II配置曝光:双系统设计,
• AI应用的东风,奥特曼不想错过
• 为新品让路!苹果定制版Mac发货延期
热门标签
更多
python
JavaScript
java
HTML
PHP
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot