/lib_stft.wav', outputs, 16000)
return outputs
其中librosa_stft是一个复数形式,我们可以获取其中的一些特征,比如
# 实部
real =...as F
from scipy.signal import get_window
def init_kernels(win_len, win_inc, fft_len, win_type=None...outputs1 = fft(inputs)[0]
outputs1 = outputs1.numpy()[0]
np_inputs = inputs.numpy().reshape...= ConviSTFT(N, inc, fft_len=fft_len, win_type='hanning', feature_type='complex')
inputs = torch.from_numpy.../conv_stft_complex.wav', outputs2.numpy()[0, 0, :], 16000)
return outputs2.numpy()[0, 0, :]