采样率和比特率:
cmd: soxi aa.mp3
Input File : 'aa.mp3'
Channels : 1
Sample Rate : 44100
Precision : 16-bit
Duration : 00:01:11.95 = 3172951 samples = 5396.18 CDDA sectors
File Size : 1.24M
Bit Rate : 138k
Sample Encoding: MPEG audio (layer I,II or III)
比特率=采样率X采样精度(位数)(*通道数)
那这里的采样率是 44.1K * 16bit = 706Kb ?结果为什么会是这样?
Input File : 'test.wav'
Channels : 2
Sample Rate : 48000
Precision : 16-bit
Duration : 00:00:04.86 = 233280 samples ~ 364.5 CDDA sectors
File Size : 933k
Bit Rate : 1.54M
Sample Encoding: 16-bit Signed Integer PCM
那这里的采样率是 48K * 16bit * 2 = 1536K = 1.54M
通过这两个的对比,发现sample encoding 是不一样的,具体直接用MPEG进行提取特征有无影响不清楚,这里可以通过ffmpeg工具进行转一些就好了。
mac ubuntu 都可以直接安装 brew 或者 apt-get.
可以用ffmpeg直接转化
ffmpeg -i aa.mp3 -ar 16000 -y aa.wav
也可以用python,也是调用的ffmpeg
from pydub import AudioSegment as AS
sound = AS.from_mp3("./aa.mp3")
print sound
sound.export("./aa.wav",format="wav")
转换之后再来看一下:
Input File : 'aa.wav'
Channels : 1
Sample Rate : 44100
Precision : 16-bit
Duration : 00:01:11.94 = 3172608 samples = 5395.59 CDDA sectors
File Size : 6.35M
Bit Rate : 706k
注意文件大小也变了很多,具体的两者的编码原理这里暂时不讨论了,我也不懂。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。