技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

android – 可以设置CMU Sphinx来识别~200个单词

时间：2020-05-20分类：Android作者：编程之家

我有一个客户端需要能够识别口头命令的 Android应用程序.根据我的理解,内置语音到文本功能实际上将数据发送到Google的服务器,然后发送回文本翻译.这是一个主要问题,因为语音数据非常敏感(除非数据在发送到Google或从Google发送时加密 – 但我怀疑它是加密的).

我可以想到两个选项.首先是在Android上转换语音到文本,虽然这似乎是一个非常昂贵的操作.第二种可能性是让本地服务器为我转换数据(我可以加密语音数据和转发时的语音数据).这是CMU Sphinx能够实现的吗？值得注意的是,我也可以访问Asterisk服务器,这可能有助于此(我不知道).

实际上,应该只有大约200个单词需要被识别.我更喜欢开源/免费软件解决方案,但我也对商业解决方案(可能是FlexT9)持开放态度.理想情况下,我可以将音频流发送到某处,获取一个String作为文本,然后我可以使用String解析并执行其他操作.

我过去没有做太多的机器人或任何语音识别开发,所以我希望有人能够至少指出我正确的方向.谢谢！

解决方法

CMUSphinx是一个开源语音识别工具包,可用于构建应用程序.它包含工具,库和数据,使您能够构建语音应用程序.您可以在上面的网站上了解有关CMUSphinx的更多信息.

在Android上,您有几种使用CMUSphinx的选项：

>识别设备上的音频.为此你可以为Android编译Pocketsphinx引擎.详情see this blog post.
>识别服务器上的音频.作为服务器,您可以使用Pocketsphinx或Sphinx4.您可以以压缩flac格式发送音频或在设备上提取语音识别功能,并将功能流发送到服务器.

CMUSphinx为您提供了几种声学模型,使您能够识别多种语言的音频,如英语,法语,普通话,德语,荷兰语,俄语.

您还可以使用自适应工具改进识别结果.

如果您对CMUSphinx有任何疑问,欢迎致电ask in our community forums.

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：android – 从每个类别中选择至少一下一篇：android – mapView显示单击时的叠

相关推荐

Android 性能优化——之控件的优化

Android性能优化——之控件的优化前面讲了图像的优化，接下来分享一下控件的性能优化，这里主要是面向自定义View的优化。 1、首先先说一下我们在自定义View中可能会犯的3个错误： 1）UselesscallstoonDraw()：我们知道调用View.invalidate()会触发Vi...

作者：张旭小侠时间：2024-09-26

android TextView描边

前言上一篇已经讲了如何实现textView中粗字体效果，里面主要重写了onDraw方法。这一边讲一个进阶功能，实现textView的描边效果。上效果图。上代码：原理讲解：效果实现思路是：因为系统api只给paint设置strokewidth方法，却没有提供设置描边的色值的方法，而且我们通

作者：张旭小侠时间：2024-09-26

GreenDao教程1

最近项目重构，涉及到了数据库和文件下载，发现GreenDao这个框架还是不错的。直接面向对象的，可以通过对对象的操作，实现数据的存储。但是官网上的API是在不敢恭维，文档写的很糙，看了半天，才搞懂一系列的流程。在此进行一下纪念。免得那天需要修改的时候，一脸懵逼。直接上干货官网地址：http://

作者：张旭小侠时间：2024-09-26

WebView加载页面的两种方式——网络页面和本地页面

WebView加载页面的两种方式一、加载网络页面加载网络页面，是最简单的一种方式，只需要传入http的URL就可以，实现WebView加载网络页面代码如下图：二、加载本地页面 1、加载assets目录下的HTML页面：加载assets目录的页面，大多数可以用来做页面数据的存储打包，这样可以

作者：张旭小侠时间：2024-09-26

Android 全局使用第三方字体

给APP全局设置字体主要分为两个方面来介绍一、给原生界面设置第三方字体 1、准备工作-下载第三方字体：传送门将文件放入工程assets目录下。（一般个人习惯单独命名一个文件夹放字体文件，也可直接放入根目录，但记得改引用路径） 2、代码实现 a、自定义application，将第三方的字体，替换当

作者：张旭小侠时间：2024-09-26

Android中粗字体

前言最近UI大牛出了一版新的效果图，按照IOS的效果做的，页面里面有普通字体、中粗字体、加粗字体。对于IOS的小伙伴，分分钟搞定，但是对于Android开发的我，瞬间懵逼了。WTF！安卓只有粗和不粗呀，哪有中粗这回事。硬着头皮做出来一版之后，看到UI嫌弃的表情。深深的刺痛了我的完美心。说啥也要搞

作者：张旭小侠时间：2024-09-26

TabLayout基本使用

前言 Tablayout继承自HorizontalScrollView，可以用作顶部标签效果、底部导航栏效果。一般多与ViewPager一起使用。想直接了解如何实现短下滑效果的请看：TabLayout的高级用法首先上几个效果图。图：使用方法下面我们来看如何使用，第一步，先在gradle引

作者：张旭小侠时间：2024-09-26

AndroidStudio 各种异常情况处理大法

最近使用AndroidStudio出现了.java文件，显示为xml文件等问题，通过各种采坑之后，发现删除本地的缓存文件这个方法最管用，差不多可以根治95%的莫名其妙的问题。解决办法如下；先将AS关闭，然后找到你电脑的目录C:\Users\用户名\.AndroidStudio3.5\system\

作者：张旭小侠时间：2024-09-26

Android文件各种存储路径的比较

1、File cacheDir = context.getCacheDir(); 应用内部存储空间（数据文件私有）文件存储到这个路径下，不需要申请权限，当应用被卸载的时候，目录下的文件会被删除。需要注意的是，这个文件的目录和应用的存储位置有关，当应用被移动到外部存储设备的时候，文件的绝对路径也是

作者：张旭小侠时间：2024-09-26

汉诺塔问题

汉诺塔问题最近面试题遇到过汉诺塔的问题，当时竟然懵逼了，不会了！！大学研究的问题竟然都忘光了，于是抓紧捡起来。然而在网上看了看博客，发现非递归算法还真挺多。下面总结了一下。一、递归算法 1、递归算法优缺点：递归算法算是最易于理解也是最容易实现的，但是对内存的消耗也是巨大的，因为递归需要系统堆栈来

作者：张旭小侠时间：2024-09-26

小编推荐

苹果市值2025年有望达4万亿美元