前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >语音识别应用场景(3):声纹识别打造个性化语音指纹

语音识别应用场景(3):声纹识别打造个性化语音指纹

作者头像
用户7623498
发布于 2020-08-04 08:30:34
发布于 2020-08-04 08:30:34
2.6K0
举报

先来一段感觉不错的概念宣传片(非广告宣传,纯学习研究)

声纹识别最早是在40年代末由贝尔实验室开发,主要用于军事情报领域,随着该项技术的逐步发展,60年代末后期在美国的法医鉴定、法庭证据等领域都使用了该项技术,从1967年到现在,美国至少5000多个案件包括谋杀、强奸、敲诈勒索、走私毒品、赌博,政治腐败等都通过声纹识别技术提供了有效的线索和有力的证据。特别强调的是,声纹鉴别目前已经是公安部的标准,是可以作为证据进行鉴定的。

相较于声纹识别,大众可能对语音识别更为熟悉,但二者有本质的区别。语音识别是“说什么”,声纹识别是“谁在说”。而语音识别必然会从“说什么”发展到“谁在说”。而传统智能语音技术的瓶颈在于它不能区分说话人身份,也就无法提供相应的个性化服务,实现真正意义的交互。语音场景下要解决身份识别的问题,需要基于声纹生物信息ID的声纹识别技术支持。

声纹识别的生物学基础

声纹识别的理论基础是每一个声音都具有独特的特征,通过该特征能将不同人的声音进行有效的区分。这种独特的特征主要由两个因素决定,第一个是声腔的尺寸,具体包括咽喉、鼻腔和口腔等,这些器官的形状、尺寸和位置决定了声带张力的大小和声音频率的范围。因此不同的人虽然说同样的话,但是声音的频率分布是不同的,听起来有的低沉有的洪亮。每个人的发声腔都是不同的,就像指纹一样,每个人的声音也就有独特的特征。

第二个决定声音特征的因素是发声器官被操纵的方式,发声器官包括唇、齿、舌、软腭及腭肌肉等,他们之间相互作用就会产生清晰的语音。而他们之间的协作方式是人通过后天与周围人的交流中随机学习到的。人在学习说话的过程中,通过模拟周围不同人的说话方式,就会逐渐形成自己的声纹特征。

因此,理论上来说,声纹就像指纹一样,很少会有两个人具有相同的声纹特征。

声纹识别的技术分类

声纹识别在技术方面有分为两类:即说话人确认技术和说话人辨认技术,说话人确认技术是用于判断未知说话人是否为某个指定人;后者则是用于辨认未知说话人是已记录说话人中的哪一位。

用工程语言来说,目前声纹识别共有“1:1识别”和“1:N识别”两种。以最具代表性的微信语音锁为例,其所实现的就是 1:1 的识别,即确认“你是你”;又比如行业知名企业 SpeakIn 在实现 1:1 的技术之外,还实现了更复杂的 1:N 的识别,也就是在确认“你是谁”,在大量的动态数据中准确锁定用户,从而服务于更广阔的使用场景。1:1 是“我知道跟谁比”,而 1:N 是不知道在跟谁比的,N 的数量级越大,搜索的复杂度就越高,对技术的要求也就越高。

声纹识别的基本技术原理

声纹识别常用的方法包括模板匹配法、最近邻方法、神经元网络方法,VQ聚类法等。这些方法虽然处理手段不同,但基本原理是类似的,都是基于上一周提到的声谱图《语音识别中的声学特征提取:梅尔频率倒谱系数MFCC》,声谱图是声音信号的一种图像化的表示方式,它的横轴代表时间,纵轴代表频率,语音在各个频率点的幅值大小用颜色来区分。说话人的声音的基频及谐频在声谱图上表现为一条一条的亮线,再通过不同的处理手段就可以得到不同语谱图之间的相似度,最终达到声纹识别的目的。

目前公安部声纹鉴别就采用类似方法,而且语谱图还是用的灰度来表示。主要抽取说话人声音的基音频谱及包络、基音帧的能量、基音共振峰的出现频率及其轨迹等参数表征,然后再与模式识别等传统匹配方法结合进行声纹识别。

声纹识别的优势

首先,语言是人类沟通最自然的工具,且具有指令性。语音作为最天然入口,在万物互联的时代无疑是爆点之一。同时,相较于其他生物识别技术,声纹语料收集的方式也更为自然,不需要特定说话或摆动作,我们平时自然交谈的内容都可以作为数据录入。

另一点是“内容变化”特点。在身份识别过程中,与固定的指纹和只能做简单动作的人脸相比,语音具有内容变化,可以随机改变朗读内容,所以即便在网上或其他地方留下的声音信息,也难以被复制和盗用,因此声纹识别的防攻击性更高,更加安全。

第三点就是使用成本低。人脸识别需要摄像头,而声纹识别只需要麦克风,这两者相比,后者的造价和安装成本都更低,对于商务来说更容易使用,也就更方便推广和使用。

此外,物联网正在蓬勃发展,对于没有屏幕和键盘或是屏幕非常小的硬件,语音是目前最合理的操作入口,因此声纹识别也是最适合大范围在物联网场景下使用的验证方式和服务入口。

声纹识别的应用场景

(1)信息领域。比如在自动总机系统中,把身份证之声纹辨认和关键词检出器结合起来,可以在姓名自动拨号的同时向受话方提供主叫方的身份信息。前者用于身份认证,后者用于内容认证。同样,声纹识别技术可以在呼叫中心(Call Center)应用中为注册的常客户提供友好的个性化服务。

(2)银行、证券。鉴于密码的安全性不高,可以用声纹识别技术对电话银行、远程炒股等业务中的用户身份进行确认,为了提供安全性,还可以采取一些其他措施,如密码和声纹双保险,如随机提示文本用文本相关的声纹识别技术进行身份确认(随机提示文本保证无法用事先录好的音去假冒),甚至可以把交易时的声音录下来以备查询。

(3)公安司法。对于各种电话勒索、绑架、电话人身攻击等案件,声纹辨认技术可以在一段录音中查找出嫌疑人或缩小侦察范围;声纹确认技术还可以在法庭上提供身份确认(同一性鉴定)的旁证。在监狱亲情电话应用中,通过采集犯人家属的声纹信息,可有效鉴别家属身份的合法性。在司法社区矫正应用中,通过识别定位手机位置和呼叫对象说话声音的个人特征,系统就可以快速的自动判断被监控人是否在规定的时间出现在规定的场所,有效地解决人机分离问题。

(4)军队和国防。声纹辨认技术可以察觉电话交谈过程中是否有关键说话人出现,继而对交谈的内容进行跟踪(战场环境监听);在通过电话发出军事指令时,可以对发出命令的人的身份进行确认(敌我指战员鉴别)。目前该技术在国外军事方面已经有所应用,据报道,迫降在我国海南机场的美军EP-3侦察机中就载有类似的声纹识别侦听模块。

(5)保安和证件防伪。如机密场所的门禁系统。又如声纹识别确认可用于信用卡、银行自动取款机、门、车的钥匙卡、授权使用的电脑、声纹锁以及特殊通道口的身份卡,把声纹存在卡上,在需要时,持卡者只要将卡插入专用机的插口上,通过一个传声器读出事先已储存的暗码,同时仪器接收持卡者发出的声音,然后进行分析比较,从而完成身份确认。同样可以把含有某人声纹特征的芯片嵌入到证件之中,通过上面所述的过程完成证件防伪。

【参考文章】

1、http://baijiahao.baidu.com/s?id=1578583738100712685&wfr=spider&for=pc

2、https://www.leiphone.com/news/201611/ISBPJpacXH5bI7hE.html

3、https://baike.baidu.com/item/%E5%A3%B0%E7%BA%B9%E8%AF%86%E5%88%AB/2101887?fr=aladdin

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-07-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 决策智能与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
声纹识别技术:安全指数更高但其发展仍面临重重阻碍
在众多生物识别技术中,除了早已使用多年的指纹识别、虹膜识别,近期兴起的人脸识别技术被用于公司打卡、软件系统登录、家庭或公共场所的安防等多个场景,而语音识别技术的用途更是广泛,机器人、智能家居产品、无人车等等。 随着相关算法的精进,以上生物识别技术的准确率已经可以与人类相媲美。而在这些识别技术愈加成熟之时,越来越多的人将目光放在另外一种生物识别技术上——声纹识别。 什么是声纹识别技术? 声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术。人在讲话时使用的发声器官舌、牙齿、喉头、肺、鼻腔在尺寸和形态
镁客网
2018/05/29
1.7K0
人工智能技术在声纹识别方面的应用 | 解读技术
人工智能技术对于传统产业的推进作用越来越凸显,极大提升了传统产品的商业价值。“听声识我,开口即播”长虹CHiQ5人工智能电视成为全球首款搭载声纹识别的人工智能电视,可以直接通过每个人说话的声音不同而区分目前使用电视用户是谁,从而实现内容的精准推荐。无需借助遥控和手机等智能设备,通过识别家庭成员的声纹来控制电视。语音助手配备海量语音库,使用语义模糊识别功能,即使说错片名也能自动识别出你想要的内容,但是当人们在观看某一节目的时候谈论提及其他电视节目名称,语音助手功能识别后当即转换到另一个节目影响正常节目的观看。但是在价格方面,55寸售价7597元,65寸售价13997元,75寸售价21997元,价格过高难以普及,但是也从侧面证明人工智能确实可以提升产品附加值。
用户7623498
2020/08/04
2K0
人工智能技术在声纹识别方面的应用 | 解读技术
人工智能:声纹相关基础概念介绍
现实生活中大家可能比较常见的是指纹识别,比较常见的使用场景有手机指纹识别、智能门指纹识别等方面,那么什么是声纹呢?
小明互联网技术分享社区
2023/11/27
4460
人工智能:声纹相关基础概念介绍
最强大脑第二场战平听音神童!百度大脑小度声纹识别技术算法解析
日前,继在江苏卫视《最强大脑》第四季“人机大战”首轮任务跨年龄人脸识别竞赛中击败人类顶级选手后,在上周五晚上,百度的小度机器人再次在声纹识别任务上迎战名人堂选手——11岁的“听音神童”孙亦廷,双方最终以1:1打成平手。被称为“鬼才之眼”的水哥(王昱珩)宣布再度出山,将在下周的第三轮比赛中与“小度”在图像识别方面一决高下。 本轮题目规则为:从“千里眼”到“顺风耳”,节目组将第二场比赛范围划定在“听”的领域,策划出高难度选题《不能说的秘密》,由周杰伦化身出题人,从21位性别相同、年龄相仿、声线极为相似的专业合
用户1737318
2018/06/06
8120
网络安全第三讲 身份认证与访问控制
​ 2. 基于生物学信息的方案包括基于指纹识别的身份认证、基于语音识别的身份认证以及基于视网膜识别的身份认证等。
易兮科技
2020/10/28
5.4K0
网络安全第三讲 身份认证与访问控制
【扫盲篇】一文读懂生物识别技术
目前主流的六种生物识别技术:指纹识别、人脸识别、掌纹识别、虹膜识别、声纹识别和静脉识别。还有更多的生物识别技术如耳膜、步态、笔迹、击键动态等等正在被研究和应用落地。
巫山老妖
2023/08/28
9000
【扫盲篇】一文读懂生物识别技术
声纹识别在智能家居中备受青睐,但还面临一些“困扰”
近日,根据调查机构CIRP的报告显示,亚马逊在2014年11月推出的Echo系列智能音箱产品在美销量已突破510万台。并且,根据市场数据,CIRP推算2016年前九个月亚马逊就已经售出200万台Echo产品(包括Echo DotEcho Tap)。 看到亚马逊的智能音箱销量如此之好,我们都意识了智能家居语音控制系统的前景之利好。不过,即使当前的语音识别技术已经基本上达到了人们所需要的标准,在智能家居语音控制系统之中,仍然有一些瑕疵的存在,比如在人声嘈杂的环境里,如何正确识别出用户发出的命令。 出于需求,声纹
镁客网
2018/05/29
1.1K0
[深度学习概念]·声纹识别技术简介
声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术。从直觉上来说,声纹虽然不像人脸、指纹的个体差异那样直观可见,但由于每个人的声道、口腔和鼻腔也具有个体的差异性,因此反映到声音上也具有差异性。如果说将口腔看作声音的发射器,那作为接收器的人耳生来也具备辨别声音的能力。
小宋是呢
2019/06/27
4.5K0
[深度学习概念]·声纹识别技术简介
声纹识别 | attention在声纹识别中的应用
最近看了几篇文章,都是关于注意力机制在声纹识别中的应用。然后我主要是把其中两篇文章整合了一下,这两篇文章发表在interspeech 2018/19上。两个团队分别是港科和约翰霍普金斯大学(Daniel povey);以及东京工业大学
马上科普尚尚
2020/06/09
3.4K1
声纹识别 | attention在声纹识别中的应用
Milvus 实战|生物多因子认证系列 (一):声纹识别
声纹识别(又称说话人识别)是从说话人发出的语音信号中提取声纹信息,并对说话人进行身份验证的一种生物识别技术。简单来说,声纹识别技术可以“确认说话人是谁”。我们说话的时候,每个人的发音器官、发音通道和发音习惯上都有个体差异,声纹识别技术就是为了识别出说话人之间的这些差异。需要注意的是,声纹识别不同于常见的语音识别 [1]:
Zilliz RDS
2020/06/28
1.8K0
【深度】小度VS最强大脑声纹识别战成平局,吴恩达详解技术原理
【新智元导读】 2016年1月13日晚,百度人工智能代表“小度”与最强大脑选手孙亦廷在声纹识别上展开人机大战,最终双方战平。本文带来百度首席科学家吴恩达对百度声纹识别技术的全面解读,本次比赛百度使用了两个不同的算法模型:DNN-ivector 和基于端到端深度学习的说话人信息提取。另外,吴恩达还对深度学习当下的发展态势以及对抗生成网络进行了评论。 2016年1月13日晚,百度人工智能代表“小度”与最强大脑选手孙亦廷在声纹识别上展开人机大战,最终双方战平。在总比分上,小度凭借着上周险胜王峰,继续保持领先优势。
新智元
2018/03/27
9950
【深度】小度VS最强大脑声纹识别战成平局,吴恩达详解技术原理
基于Kersa实现的中文语音声纹识别
本项目说是使用Keras,但使用的都是Tensorflow下的keras接口,本项目主要是用于声纹识别,也有人称为说话人识别。本项目包括了自定义数据集的训练,声纹对比,和声纹识别。
夜雨飘零
2021/12/07
2.8K0
学界 | 现实版柯南「蝴蝶结变声器」:谷歌发布从声纹识别到多重声线语音合成的迁移学习
音频按顺序分别为参考音频 1、以参考音频 1 的声线为输入的生成句子 1(Take a look at these pages for crooked creek drive.)、生成句子 2(There are several listings for gas station.)、参考音频 2、以参考音频 2 的声线为输入的生成句子 1(同上)、生成句子 2(同上)。
机器之心
2018/07/26
1.4K0
学界 | 现实版柯南「蝴蝶结变声器」:谷歌发布从声纹识别到多重声线语音合成的迁移学习
声纹识别技术助力远程身份认证
作者 | 李通旭,刘乐 责编 | 何永灿 “声纹”作为一种典型的行为特征,相比其他生理特征在远程身份认证中具有先天的优势,文章介绍了声密保在远程身份认证中的应用,解析了一些在声纹识别准确率、时变问题和噪音问题等方面的技术难点和工程解决经验,最后针对远程身份认证的安全性问题,分享了得意音通在防录音闯入上的最新研究成果。希望对广大读者有所帮助。 声纹在远程身份认证中的应用 网络安全面临重大挑战 无线互联网以及智能手机的迅速发展,给人们日常生活带来极大便利的同时也带来了不容忽视的安全隐患,如何准确、迅速、安全地
用户1737318
2018/06/05
2.4K0
依图科技声纹识别权威竞赛夺冠,智能语音再下一城
在奥地利召开的机器语音国际顶会 InterSpeech 2019 上,国际声纹识别权威竞赛 VoxCeleb Speaker Recognition Challenge(VoxSRC)公布最新结果,依图科技大幅领先海内外多支强队获得冠军,再次展示了世界级人工智能算法实力。
AI科技评论
2019/09/12
1.2K0
依图科技声纹识别权威竞赛夺冠,智能语音再下一城
学界 | 只对你有感觉:谷歌用声纹识别实现定向人声分离
「语音识别」已经跟随着手机语音助手和智能音箱的普及变成了普通人日常生活的一部分,然而尽管包括谷歌、微软在内的诸多公司纷纷宣称其模型可以在标准数据集上「词错率降低到 6% 以下」、「水平超过普通人」乃至「水平超过专业速记员」,但是真实的场景里有很多标准数据集上不会出现的情况:远场问题、鸡尾酒会问题、中英文夹杂问题等等,这些情况的存在导致现实生活中,语音识别模型的效果还远远达不到人类的期望,亟待解决的问题还有很多。
机器之心
2018/11/06
2.3K0
重磅丨直击“人机大战”第二轮:声纹识别百度小度1:1战平人类,比赛的背后究竟发生了什么?
如果说在上一轮人机大战的人脸识别对决中,由于小度对阵了并不擅长人脸识别的王峰,令比赛意义打了折扣,那么昨天进行的第二轮声音识别的人机大战,虽然最终只是战平,但对于AI 界的意义却似乎更大。 原因有两点:一、公认实力顶尖的对手;二、业界公认困难的比赛内容。 在对手上,此次迎战百度小度的是名人堂公认最擅长声音辨别的选手孙亦廷,他辨别声音细节的能力在名人堂无出其右,能通过水球从0~70米高空坠地破碎的声音,来准确辨别水球下落时的高度。这相当于在一根70米长的琴弦上拉奏任意位置,他都通过音高准确辨别拉弦的位置,甚至
AI科技评论
2018/03/09
1.3K0
重磅丨直击“人机大战”第二轮:声纹识别百度小度1:1战平人类,比赛的背后究竟发生了什么?
左手握技术,右手握需求,但声纹识别依旧当不了“独行侠”
因为智能AI语音助手“小欧”的语音唤醒、解锁功能,用户花了5000元买了一部OPPO的手机。这事没让用户感到兴奋,反而有点恐慌。
镁客网
2018/12/05
9100
干货 | 清华大学郑方:语音技术用于身份认证的理论与实践
“网络空间身份认证”事关新时代的国家安全、经济安全、社会稳定、民众福祉等,这其中包括五个方面:
数据派THU
2018/12/11
1.2K0
干货 | 清华大学郑方:语音技术用于身份认证的理论与实践
[深度学习概念]·声纹锁与声纹识别技术原理解析
声纹锁的工作原理是什么?声纹识别技术原理是怎样的?声纹锁也是智能门锁的新兴品种。利用声纹识别技术进行开锁,在门锁中也开锁得到了应用。声纹锁和指纹锁有着异曲同工之妙,与指纹锁基于指纹识别技术不同的是,声纹锁是对于声音的技术识别,本文将为大家解释声纹锁识别的技术原理。
小宋是呢
2019/06/27
3.1K0
[深度学习概念]·声纹锁与声纹识别技术原理解析
推荐阅读
相关推荐
声纹识别技术:安全指数更高但其发展仍面临重重阻碍
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档