技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

从iOS上的麦克风输入进行语音活动检测

时间：2020-05-18分类：iOS作者：编程之家

我正在开发一个基于语音的AI的iOS应用程序;即它意味着从麦克风接收语音输入,将其转换为文本,将其发送到AI代理,然后通过扬声器输出返回的文本.我已经完成了所有工作,但是使用按钮开始和停止录制语音(SpeechKit用于语音识别,API.AI用于AI,亚马逊的Polly用于输出).

我需要的是让麦克风始终打开,并在用户开始和结束谈话时自动开始和停止录制用户的声音.这个应用程序正在开发一个非正统的环境,在那里将无法访问用户的屏幕(但他们将有一个用于录制文本的高端霰弹枪麦克风).

我的研究表明,这个难题被称为“语音活动检测”,似乎是整个基于语音的AI系统中最困难的步骤之一.

我希望有人可以提供一些简单的(Swift)代码来自己实现,或者指向我可以在这个项目中实现的一些像样的库/ SDK的方向.

解决方法

为了获得良好的VAD算法,您可以使用 py-webrtcvad.

它是C代码的Python接口,您只需从项目中导入C文件并从swift中使用它们即可.

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：ios – SpriteKit在转换到新场景时下一篇：无法从iOS 7中的App Store Receipt

相关推荐

iOS开发-UITabbarController的介绍与使用

UITabBarController 是 iOS 中用于管理和显示选项卡界面的一个视图控制器。它允许用户在多个视图控制器之间进行切换，每个视图控制器对应一个选项卡。主要功能管理多个视图控制器： UITabBarController 管理一个视图控制器数组，每个视图控制器对应一个选项卡。显示选项

作者：机械心时间：2024-09-26

iOS开发-UITableView的重用机制

UITableView的重用机制避免了频繁创建和销毁单元格的开销，使得在显示大量数据时，保持流畅的用户体验和较低的资源消耗。。当UITableView滚动时，屏幕上移出视图的单元格会被回收到一个重用池中。当需要显示新的单元格时，UITableView会首先检查重用池中是否有可用的单元格。如果有，就

作者：机械心时间：2024-09-26

iOS开发-属性的内存管理

Objective-C中，类的实例变量（instance variables）和属性（properties）是两种不同的概念，其中属性的内存管理就较为复杂。Objective-C 提供了多种属性修饰符，用于管理对象的内存。这些修饰符用于控制对象的生命周期和内存管理行为。以下是一些常见的属性修饰符及

作者：机械心时间：2024-09-26

OC-从内存角度理解block可作为方法传入参数的原因

从内存管理的角度来看，block可以作为方法的传入参数是因为block在Objective-C中被设计为一种特殊的对象，它们可以在堆（heap）上分配和管理。这使得block可以像其他对象一样被传递、复制和持有。以下是一些关键点，解释为什么block可以作为方法的传入参数： 1. Block的类型和

作者：机械心时间：2024-09-26

iOS开发-WKWebView的介绍与基本使用

WKWebView 是 iOS 开发中用于显示网页内容的组件，它是在 iOS 8 中引入的，作为 UIWebView 的替代品。WKWebView 提供了更高的性能和更多的功能，它是基于 WebKit 引擎的，这也是 Safari 浏览器所使用的引擎。主要特性性能提升：相比于老旧的 UIWebV

作者：机械心时间：2024-09-26

iOS开发-多线程编程

OC中常用的多线程编程技术： 1. NSThread NSThread是Objective-C中最基本的线程抽象，它允许程序员直接管理线程的生命周期。 NSThread *myThread = [[NSThread alloc] initWithTarget:self selector:@selec

作者：机械心时间：2024-09-26

iOS开发- Xcode常用的快捷键

以下是一些常用的 Xcode 快捷键：构建和运行: Command + B: 构建当前项目。 Command + R: 构建并运行当前项目。 Command + .: 停止运行项目。代码编辑: Command + ] / Command + [: 增加或减少当前行或选中代码的缩进。 Contro

作者：机械心时间：2024-09-26

iOS面试题-tableivew上面展示图片的时候，在网络还未回来时，将cell滑走，那被划走的cell还会不会显示图片？

当在UITableViewCell中加载网络图片时，如果在图片下载完成之前用户滑动了UITableView，使得对应的UITableViewCell已经滑出屏幕，那么这个被滑走的UITableViewCell是否还会显示图片，取决于如何处理图片的加载和UITableViewCell的重用。 UITa

作者：机械心时间：2024-09-26

iOS开发-手势

UIGestureRecognizer 用于检测和处理手势的抽象基类。提供了检测用户手势的基本功能，如点按、滑动、捏合、旋转等。通过使用 UIGestureRecognizer 子类，可以为视图添加手势识别功能，增强用户交互体验。常见的 UIGestureRecognizer 子类一些常见的手势

作者：机械心时间：2024-09-26

iOS开发-图片UIImage

UIImage 和 UIImageView 是 iOS 开发中常用的两个类，分别用于表示图像数据和显示图像。 UIImage UIImage 是一个表示图像数据的类，可以从文件、数据、图像资源库等加载图像。UIImage 支持多种图像格式，包括 PNG、JPEG、GIF 等。创建 UIImage

作者：机械心时间：2024-09-26

小编推荐

苹果市值2025年有望达4万亿美元