你说得对
利布罗萨
始终将样本标准化为单声道
[-1:1]
(还有22050赫兹)。这就是说,它是数字音频,所以可以与任何你想得到不同规模的乘法。如果你坚持的话,你的样品是在
-2^15
到
2^15
,只需乘以
2^15
.它的意思基本相同。
除了将音频编码格式的一个特性拖到数据中之外,您不会获得任何东西。
也就是说,如果这是你想要的,你可以使用
PySoundFile
这样地:
import soundfile as sf
y, sr = sf.read('existing_file.wav', dtype='int16')
参数
dtype='int16'
告诉库对每个样本采用有符号的16位格式。