随着视频云向产业垂直化和智能化的不断渗透和发展,视频云和人工智能的结合已经成为一种产业趋势。目前,有许多用于语音和图像的人工智能技术在人工智能中占有一席之地,例如语音到文本、文本到语音、声纹识别、证书识别、人脸识别和其他相关技术。
众所周知,计算机视觉、智能语音识别、自然语言处理、高性能计算、海量数据存储、强健的全球基础设施网络、高效的CDN网络和全球资源布局都是AI - as - service智能云的主干结构。
昨天,滕旭云安全日皇家发布了一个基于音频的视频监控系统,该系统已经在滕旭云的点播和直播服务中在线使用,以进一步提高色情内容的检测率。视频监控系统目前每天处理超过1亿篇音像制品,每天识别数十万篇色情音像制品,准确率超过95 %。
值得一提的是,该系统还使用I - Vector + DNN嵌入来执行长音频和短音频的特定检测,并结合各种通道补偿算法来确保系统的识别性能和高实时率。可以识别1秒的音频和0.02秒的通信云。
领取专属 10元无门槛券
私享最新 技术干货