如何在同一音频剪辑()的音频文件列表中确定最佳的音频质量,而无需查看音频文件的头部。棘手的部分是,所有的文件来自不同的格式和比特率,他们所有的转码到相同的格式和比特率。如何有效地做到这一点?
发布于 2010-06-17 11:39:06
这里概述的许多答案涉及到常见的音频测量,如THD+N、信噪比等。然而,这些并不总是与人类对音频伪影的听觉有很好的关联。有损耗的音频压缩技术通常通过提高THD+N和信噪比发挥作用,但其目的是以难以检测到的方式实现。一种更传统的音频测量技术可能会发现某一频带的信噪比下降,但如果相邻频段的能量如此之多,以至于没有人会注意到这种差异,这是否重要呢?
这篇题为"基于心理声学表示法的感知音频质量测量“的研究论文基于一个关于耳朵听力的模型,概述了一种量化人类耳朵检测听觉差异能力的算法。它考虑了与人类感知的音频质量相关的因素。本文包括一项研究,将它们的算法结果与主观的双盲测试结果进行比较,以使您了解它们的模型工作得如何。
我找不到这份文件的免费副本,但是一个像样的大学图书馆应该把它存档。
实现该算法需要一定的频域音频信号处理知识。一个有DSP经验的本科生应该能够实现它。如果您没有参考波形,您可以使用本文中的信息来量化可能是多么令人讨厌的工件。
该算法将工作在PCM音频,最好是时间对齐,当然不需要知识的文件类型或头。
发布于 2010-05-31 13:58:20
我不是一个软件开发人员(我是一个音频工程师),当您使用mp3算法压缩时,您听到的是:-较低的高频:所以您可以检查较高范围失真的立体声的能量损失:这样您就可以制作一个中间/侧矩阵,并在没有相位相干性的侧面检查THD :也许您可以用相关计来检查这一点。
希望它能帮上忙,这对一台电脑来说是一项艰巨的任务!
发布于 2010-06-17 20:44:00
首先,我不是一个音频工程师,但是我一直试图保持关于音频压缩的联系,因为我有一个很大的mp3集合,我有一些关于这个主题的想法。
从人类的角度来看,你想要的是最好的音频质量吗?如果是这样的话,你就不能用“客观手段”来衡量,比如比较平面图之类的。
如果一个平面图是丑陋的,它的不一定意味着的质量是可怕的。重要的是,如果有人能够区分编码文件和原始源,做一个盲测试。句号。如果您想检查编码音频轨道的质量,您必须执行盲ABX试验。
采购产品LAME (和所有其他有损的MP3,AAC,AC3,DTS,ATRAC.)压缩机)被称为感知编码器。它利用了关于人类听觉感知本质的某些事实。因此,你不能简单地依靠光谱图来评价它的质量。
现在,如果您的目标是从客观的方式/角度出发,您可以使用EAQUAL,它表示对音频质量的评估:
这是一种客观的测量技术,用于测量编码/解码音频文件的质量(非常类似于PEAQ)。 (...) 然而,当使用客观的测试方法时,结果仍然是不确定的,主要是由编解码器开发人员和研究人员使用。
...or 弗里德曼统计分析工具.
(...)对数据集进行几个统计分析,这些数据集特别适合听力测试数据。
,我不是说频谱分析仪是无用的,这就是为什么我发布了一些实用工具。我只是说要小心所有这些统计方法:作为说过一次,社区的人,你不会用眼睛去听。(看看我发的这个帖子,这是一个很好的资源)。要从人类的角度来证明音频的质量,你应该测试耳朵而不是图表。
这是一个复杂的主题,我建议你找一个像氢音频这样的专业音频社区。
https://stackoverflow.com/questions/2945531
复制