如何解决语音转文本应用:实时计算麦克风中特定单词的数量
假设您想编写一个 Python 程序,计算无限期对着麦克风说的“嘿,Siri”或“嘿谷歌”的数量。
import sounddevice as sd
import numpy # Make sure NumPy is loaded before it is used in the callback
import heySiri_recognizer as hsr
heySiri_counter =0
def callback(indata,outdata,frames,time,status):
if status:
print(status)
if indata.hsr():
heySiri_counter += 1
outdata[:] = indata
try:
with sd.Stream(device=(args.input_device,args.output_device),samplerate=args.samplerate,blocksize=args.blocksize,dtype=args.dtype,latency=args.latency,channels=args.channels,callback=callback):
print('#' * 80)
print('press Return to quit')
print('#' * 80)
input()
print(heySiri_counter)
except KeyboardInterrupt:
parser.exit('')
except Exception as e:
parser.exit(type(e).__name__ + ': ' + str(e))
在上面的代码中,如果你能帮助/评论我如何处理这个(多线程、异步、块大小(音频缓冲区)等)以及假设的 heySiri_recognizer 模块,我非常感谢它
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。