我正在从SFVoiceAnalytics“音调”中检索值。我的目标是将数据转换为原始基频。根据文档,返回的值是log_e。当我对返回的值应用exp()时,得到以下范围:
男性声音: 0.25,1.85,预期: 85,180
女性声音: 0.2,1.6,预期: 165,255
为了简单起见,我正在使用苹果的示例代码“识别现场音频中的语音”。
谢谢你的帮助!!
文档:
if let result = result {
// returned pitch values
for segment in result.bestTranscri
我已经实现了一个基于lucene的软件来索引1000多万个人的名字,这些名字可以用不同的方式书写,比如"Luíz“和"Luis”。索引是使用各个标记的语音值创建的(创建了一个自定义分析器)。
目前,我正在使用QueryParser查询给定的名称,结果很好。但是,在"Lucene in Action“一书中提到,SpanNearQuery可以使用标记的近似性来改进我的查询。我在SpanNearQuery上使用了一个非语音的名字索引,与QueryParser相比,结果更好。
因为我们应该使用用于索引的相同分析器进行查询,所以我找不到如何同时使用自定义语音分析器和SpanNe