我可以使用Swift for iOS录制音频,并播放录制的音频文件。我想问的是,是否可以检查录制的音频文件的背景噪声&音量/分贝,这样我就可以确定它对于我的speech to text框架是否足够好。框架不是问题所在,我研究了所有可用的框架。我没有太多的音频知识,但我研究了一下,发现我可以在录音时获得峰值和平均分贝值,但背景噪音呢?
我在试着给语音探测器编程。到目前为止,我可以使用audiorecord来读取音频数据,但是我得到了一个奇怪的频率响应。我是这样读取数据的:private int audioEncoding然后,我在Matlab中创建音频音调,就像这里的,然后我播放它们。我在300到20000赫兹范围内获得了良好的读数。在300赫兹之前,我得不到好的结果,只有振荡值。这让我认为有一种带通滤波器。当我在静默场景下录