如何解决如何在 Python 中使用语音识别处理嘈杂的记录
我正在使用“speech_recognition”将记录转换为文本。 实际上,我的代码适用于“清除”记录。
import speech_recognition as sr
audioFile=("payload1.wav")
r = sr.Recognizer()
with sr.AudioFile(AUdio_FILE) as source:
audio = r.record(source)
print(r.recognize_google(audio))
我有一些以嘈杂声音开头的唱片,但后来变得清晰。 当我想转换嘈杂的记录时,出现错误:
Audio file Could not be read as PCM WAV,aifF/aifF-C,or Native FLAC; check if file is corrupted or
in another format
如果我用 Audacity(一个编辑记录的程序)剪掉它的嘈杂部分 它有效
如何确定 Python 中的噪声部分?
例如;我想检测并剪切 100 到 200 频率之间的记录部分。
提前致谢。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。