微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

从频谱图重建音频

如何解决从频谱图重建音频

我已经按照 (https://www.mathworks.com/help/signal/ref/stftmag2sig.html) 从声音中构建了一个频谱图。我已将频谱图导出并保存为 png 图像。我现在想要的是,在 matlab 或任何替代平台中导入图像并从中构建音频。我浏览了许多帖子和阅读材料,但它们没有处理从图像中生成音频的问题。大多数情况下,他们依赖声音信息进行重建,其中频谱图仅出于可视化目的而出现,仅此而已。附上 untitled.png 图片以供参考。

解决方法

在您引用的文档之后:

s = imread('im.png') // see remarks below
x = stftmag2sig(s,nfft) // x is your audio

s 是您的形象。 OP 生成这些频谱图,因此他控制输出。基于此:

  • 避免使用有损图像格式,并确保不会发生重新缩放/插值。您的像素应包含来自给定时间窗口 (nfft) 和频率区间的幅度。
  • 要么生成仅包含频谱图(无轴)的图像,要么知道频谱图的确切坐标
  • 请勿在光谱图中使用颜色。它看起来不错,但是对于如何将 3 元组颜色映射到幅度引入了完全不必要的歧义。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。