技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

ios – 使用开放耳朵进行语音识别时的精度非常低

时间：2020-05-21分类：iOS作者：编程之家

我的应用程序中使用耳朵进行语音识别.主要关注的是准确性.在一个安静的环境中,精确度约为50％,但在嘈杂的环境中情况会变得更糟.几乎没有任何东西被正确识别.目前我正在使用约300字的字典文件.我应该寻找哪些方面来提高准确度？到目前为止,我还没有做任何调整.

解决方法

语音识别应用的设计要求您了解语音识别背后的一些基本概念,如声学模型,语法和语音字典.您可以从CMUSphinx教程 http://cmusphinx.sourceforge.net/wiki/tutorial了解更多信息

语言应用程序开发的正确状态不正确,您可以使用一个过程来改进语言,使应用程序变得有用.过程如下：

收集您想要识别的语音样本,并创建一个语音数据库来衡量当前的准确性并了解其背后的问题
>尝试用词汇大小来改善不同之间的分隔
语音提示.例如,10个命令的词汇比300个命令的词汇更容易识别.
>设计您的应用程序,以识别的变体的数量较少
人的答案是直截了当的.这个活动被称为VUI(语音用户界面设计),它是很多精采书籍和博客文章的一个很大的领域.您可以在这里找到一些细节：http://www.amazon.com/Voice-Interface-Design-Michael-Cohen/dp/0321185765
>尝试改善应用程序的声部分.修改字典以符合您的演讲.调整声学模型以匹配声学特性.有关声学模型适应过程的描述,请参见http://cmusphinx.sourceforge.net/wiki/tutorialadapt.

原文地址：https://www.jb51.cc/iOS/330743.html

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：ios – UIWebView中的WebSQL / SQL 下一篇：ios – Xcode 6.1直到运行时才检测

相关推荐

iOS开发-UITabbarController的介绍与使用

UITabBarController 是 iOS 中用于管理和显示选项卡界面的一个视图控制器。它允许用户在多个视图控制器之间进行切换，每个视图控制器对应一个选项卡。主要功能管理多个视图控制器： UITabBarController 管理一个视图控制器数组，每个视图控制器对应一个选项卡。显示选项

作者：机械心时间：2024-09-26

iOS开发-UITableView的重用机制

UITableView的重用机制避免了频繁创建和销毁单元格的开销，使得在显示大量数据时，保持流畅的用户体验和较低的资源消耗。。当UITableView滚动时，屏幕上移出视图的单元格会被回收到一个重用池中。当需要显示新的单元格时，UITableView会首先检查重用池中是否有可用的单元格。如果有，就

作者：机械心时间：2024-09-26

iOS开发-属性的内存管理

Objective-C中，类的实例变量（instance variables）和属性（properties）是两种不同的概念，其中属性的内存管理就较为复杂。Objective-C 提供了多种属性修饰符，用于管理对象的内存。这些修饰符用于控制对象的生命周期和内存管理行为。以下是一些常见的属性修饰符及

作者：机械心时间：2024-09-26

OC-从内存角度理解block可作为方法传入参数的原因

从内存管理的角度来看，block可以作为方法的传入参数是因为block在Objective-C中被设计为一种特殊的对象，它们可以在堆（heap）上分配和管理。这使得block可以像其他对象一样被传递、复制和持有。以下是一些关键点，解释为什么block可以作为方法的传入参数： 1. Block的类型和

作者：机械心时间：2024-09-26

iOS开发-WKWebView的介绍与基本使用

WKWebView 是 iOS 开发中用于显示网页内容的组件，它是在 iOS 8 中引入的，作为 UIWebView 的替代品。WKWebView 提供了更高的性能和更多的功能，它是基于 WebKit 引擎的，这也是 Safari 浏览器所使用的引擎。主要特性性能提升：相比于老旧的 UIWebV

作者：机械心时间：2024-09-26

iOS开发-多线程编程

OC中常用的多线程编程技术： 1. NSThread NSThread是Objective-C中最基本的线程抽象，它允许程序员直接管理线程的生命周期。 NSThread *myThread = [[NSThread alloc] initWithTarget:self selector:@selec

作者：机械心时间：2024-09-26

iOS开发- Xcode常用的快捷键

以下是一些常用的 Xcode 快捷键：构建和运行: Command + B: 构建当前项目。 Command + R: 构建并运行当前项目。 Command + .: 停止运行项目。代码编辑: Command + ] / Command + [: 增加或减少当前行或选中代码的缩进。 Contro

作者：机械心时间：2024-09-26

iOS面试题-tableivew上面展示图片的时候，在网络还未回来时，将cell滑走，那被划走的cell还会不会显示图片？

当在UITableViewCell中加载网络图片时，如果在图片下载完成之前用户滑动了UITableView，使得对应的UITableViewCell已经滑出屏幕，那么这个被滑走的UITableViewCell是否还会显示图片，取决于如何处理图片的加载和UITableViewCell的重用。 UITa

作者：机械心时间：2024-09-26

iOS开发-手势

UIGestureRecognizer 用于检测和处理手势的抽象基类。提供了检测用户手势的基本功能，如点按、滑动、捏合、旋转等。通过使用 UIGestureRecognizer 子类，可以为视图添加手势识别功能，增强用户交互体验。常见的 UIGestureRecognizer 子类一些常见的手势

作者：机械心时间：2024-09-26

iOS开发-图片UIImage

UIImage 和 UIImageView 是 iOS 开发中常用的两个类，分别用于表示图像数据和显示图像。 UIImage UIImage 是一个表示图像数据的类，可以从文件、数据、图像资源库等加载图像。UIImage 支持多种图像格式，包括 PNG、JPEG、GIF 等。创建 UIImage

作者：机械心时间：2024-09-26

小编推荐

苹果市值2025年有望达4万亿美元