如何解决如何使所有梅尔谱图具有相同的阵列形状?
我正在尝试将来自不同长度的音频文件的 Mel 频谱图用于自动语音识别系统。使用 Mel,形状为 (128,x),其中 x 因音频长度而异。
n_fft = 2048
hop_length = 512
n_mels = 128
S = librosa.feature.melspectrogram(y,sr=sr,n_fft=n_fft,hop_length=hop_length,n_mels=n_mels)
S_DB = librosa.power_to_db(S,ref=np.max)
我已经将这部分代码与给定的值一起使用。我尝试为每个频谱图创建一个空的固定长度数组,然后在其中添加 S_DB,但分类器的准确度非常低。我可以修改一些参数值来实现所有音频长度的固定数组吗?
此外,欢迎在仍然使用 Mel 频谱图的同时获得更好结果的任何其他建议。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。