微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

java – 如何使用CMU Sphinx 4进行语音与英文voxforge模型的文本

我试图找出如何使用sphinx4或pocketphinx与英语voxforge模型,但我无法让它工作.我已经尝试阅读doc页面(像这样一个 http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html),但它并没有帮助我.

我想要的是一个可执行文件,我可以指定要使用的模型和哪个音频文件用作源代码,并且可执行文件打印出来,最好猜测录音中的声音是什么.

我有一些运气:
pocketphinx_continuous -infile recording.wav 2>的/ dev / null的

但是,在完整的音频文件被转录之前,它会中止,认模型已经有几个字可以从音频创建可读的文本.

我已经编译和测试了sphinx4源码包中的演示,但是所有的例子似乎都需要几个字,并且需要一个模型,使用voxforge来对我有用.

我该如何设定?

解决方法

插入Voxforge声学模型非常简单.涵盖API的主要文档是cmusphinx教程:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

在开始之前,建议阅读它.还请注意,建议使用En_US英文通用声学模型,它比Voxforge更准确.

一步一步,您需要执行以下操作:

>从sourceforge下载voxforge model并将其解压缩到一个文件
>从github结帐sphinx4,并用gradle构建它
> Run TranscriberDemo
>转到sphinx4-samples / src / main / java / edu / cmu / sphinx / demo / transcriber文件夹,打开Transcriber演示并编辑声学模型路径如下.
>如果您需要另一个音频文件,请在源中编辑音频文件的位置
再次运行演示,享受

就是这样

// Load model from the folder in your project
   configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000");

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


应用场景 C端用户提交工单、工单创建完成之后、会发布一条工单创建完成的消息事件(异步消息)、MQ消费者收到消息之后、会通知各处理器处理该消息、各处理器处理完后都会发布一条将该工单写入搜索引擎的消息、最终该工单出现在搜索引擎、被工单处理人检索和处理。 事故异常体现 1、异常体现 从工单的流转记录发现、
线程类,设置有一个公共资源 package cn.org.chris.concurrent; import java.util.concurrent.locks.Lock; import java.util.concurrent.locks.ReentrantLock; /** * @Descrip
Java中的数字(带有0前缀和字符串)
在Java 9中使用JLink的目的是什么?
Java Stream API Filter(过滤器)
在Java中找到正数和负数数组元素的数量
Java 9中JShell中的不同启动脚本是什么?
使用Java的位填充错误检测技术
java中string是什么
如何使用Java中的JSON-lib API将Map转换为JSON对象?