简介
本文介绍如何通过控制台使用音频审核功能。该功能可对音频内容进行安全审核,检测场景包括涉黄、违法违规、广告检测等。
添加音频自动审核配置后,每当存储桶中新产生音频/文本/文档时,将自动进行检测,并支持自动冻结(禁止公有读访问)已检测的违规内容。
说明:
音频审核为收费项,由数据万象收取,详细的计费说明请参见 内容审核费用。
音频格式:支持 mp3、wav、aac、flac、amr、3gp、m4a、wma、ogg、ape 格式音频审核。
音频码率:128Kbps - 256Kbps。
音频大小:文件 < 600M。
最大时长:3小时。
音频审核可识别普通话、英语。
操作流程
操作步骤
1. 登录 对象存储控制台,在存储桶列表页面选择需操作的存储桶,进入存储桶管理页面。
2. 在左侧导航栏中,选择内容审核 > 自动审核配置,单击音频审核。
3. 单击添加音频自动审核配置,按照如下配置项说明进行配置。
审核范围:可选择审核的范围为整个存储桶、前缀匹配或通配符匹配。
整个存储桶:当上传视频到存储桶中任意位置时,将自动进行审核。
前缀匹配:您可以指定某个视频上传至存储桶中某个前缀下时进行审核或者对某个前缀指定不审核。
示例1:如您需要审核指定目录 test 内的文件,则需要填写指定前缀为 test/。
示例2:如您需要审核指定前缀为123的文件,则需要填写指定前缀为123。
通配符匹配:您可以通过通配符自定义匹配需要审核的文件,当前支持的通配符"*"、"?",如果您的路径中包含这些通配符,需要进行转译,否则我们将按通配符进行匹配。
注意:
您可以添加多条审核配置,但审核路径不能重复或存在包含关系。例如您已经配置了审核整个存储桶,则不能再添加针对存储桶内某个路径的审核。
审核后缀:音频格式支持 mp3、wav、aac、flac、amr、3gp、m4a、wma、ogg、ape,支持多选。
选择审核策略:请选择您配置的审核策略,不同审核策略对应不同的策略分类,您可以通过自定义策略定制个性化场景审核。如您未配置过,会有一个系统默认策略。支持审核涉黄、违法违规、广告审核场景,可勾选一种或多种检测场景。您可以前往 设置审核策略 查看如何配置审核策略。
审核场景:此处展示您所选择审核策略中配置的场景,您可以自定义勾选希望审核的场景。
每日审核上限:设置上限后,当日将审核固定数量音频,超出部分不再审核,次日将审核新增音频。
冻结设置:您可以选择开启该服务,开启后将授权数据万象对相应类型文件进行自动机审冻结,从而禁止公有读访问已检测的违规内容。开启服务后,您需要选择冻结的文档类型和冻结文档分值区间。
冻结方式:当前支持以下两种冻结方式。
将文件变为私有读:通过将文件的访问权限修改为私有读(private),达到文件冻结的效果。使用这种方式,再次访问文件将会返回“403”状态码,表示无权访问文件。有关文件权限的信息,可参见 文件 ACL 概述。
将文件转移到备份目录:通过将文件移动到备份文件目录,达到文件冻结的效果。使用这种方式,再次访问文件将会返回“404”状态码,表示文件不存在。备份目录由后台自动生成,位于当前存储桶下的路径为:audit_freeze_backup/increment_audit。
冻结类型: 您可指定针对不同业务场景,选择冻结的文档类型和冻结文档分值区间(即60-100的整数,分值越大则说明文档越敏感)。
回调设置:开启回调后将把相应的审核结果反馈给您。您需选择回调的审核类型、回调内容,同时设置回调 URL。回调详情请查看 回调内容。
4. 配置完成后,单击保存即可启用该功能。后续将对您新上传的音频文件进行审核。若需对历史数据进行审核,请参见 设置历史数据审核任务。
回调内容
若您开启了回调设置,当完成音频审核后,系统会向回调地址发送回调信息,内容如下所示:
{"code":0,"message":"success","data":{"url":"","result":1,"forbidden_status":1,"trace_id":"","porn_info":{"hit_flag":1,"score":91,"label":""},"ads_info":{"hit_flag":0,"score":0,"label":""}}}
参数名称 | 描述 | 类型 | 是否必选 |
forbidden_status | 冻结状态,0表示正常,1表示音频文件已被冻结 | Int | 是 |
porn_info | 涉黄信息,包括是否命中、审核分数及详细标签等 | json | 是 |
ads_info | 广告引导信息,包括是否命中、审核分数及详细标签等 | json | 是 |
result | 供参考的识别结果,0为确认正常,1为确认敏感,2为疑似敏感 | Int | 是 |
trace_id | 提交的审核任务的 jobid | String | 是 |
url | 上传后的资源 URL,包括域名 | String | 是 |
审核信息(porn_info、ads_info)中包含如下内容:
参数名称 | 描述 | 类型 | 是否必选 |
hit_flag | 是否命中该审核分类,枚举值:0(未命中)、1(命中)、2(疑似) | Int | 是 |
label | 识别出的音频标签 | String | 是 |
score | 审核分值。0 - 60分表示音频正常,60 - 90分表示音频疑似敏感,90 - 100分表示音频确定敏感 | Int | 是 |
相关说明
音频审核为打分制,对于每一段音频均有一个0 - 100的分值。
确定部分指确定是敏感音频和确定正常的音频,分值在[0,60]和(90,100]区间,我们认为音频置信度比较明确,无需用户人为干预。
不确定部分指疑似敏感音频,系统无法明确区分是否为敏感内容,分值在(60,90]区间,建议用户根据自身业务对审核强度的需求来指定分数阈值。