如何解决试图为 CMU Sphinx 寻找更好的模型
我正在编写一个程序来使用 CMU Sphinx 转录音频。我对质量不满意,我想也许我可以找到更好的模型。但我真的不明白可用模型之间的区别。 sphinx4-data jar 中有模型,然后我找到了这个页面,https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English/,但我不完全理解它们之间的区别。而且我什至不确定要使用哪些文件。
有声学模型、词典和语言模型。
我希望我的程序尽可能通用,即能够转录任何演讲(首先是英语)。什么是最好的模型?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。