前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >智能语音机器人小知识(3)--什么是语音识别技术?

智能语音机器人小知识(3)--什么是语音识别技术?

原创
作者头像
思谱云汇
修改于 2019-05-22 10:03:20
修改于 2019-05-22 10:03:20
3.7K0
举报

语音识别技术,也被称为自动语音识别Automatic Speech Recognition (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

语音识别技术的应用场景包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。

语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

历史

早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的"Radio Rex"玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。到1950年代末,伦敦学院(College of London)的Denes已经将语法概率加入语音识别中。

1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC), 及动态时间规整Dynamic Time Warp技术。

语音识别技术的最重大突破是隐马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理,经过Labiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的非特定人大词汇量连续语音识别系统Sphinx。此后严格来说语音识别技术并没有脱离HMM框架。

模型编辑

目前,主流的大词汇量语音识别系统多采用统计模式识别技术。典型的基于统计模式识别方法的 语音识别系统由以下几个基本模块所构成:

信号处理及特征提取模块。该模块的主要任务是从输入信号中提取特征,供声学模型处理。同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、信道、说话人等因素对特征造成的影响。

统计声学模型。典型系统多采用基于一阶隐马尔科夫模型进行建模。

发音词典。发音词典包含系统所能处理的词汇集及其发音。发音词典实际提供了声学模型建模单元与语言模型建模单元间的映射。

语言模型。语言模型对系统所针对的语言进行建模。理论上,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。

解码器。解码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。

国外研究

20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。语音识别技术有一个很好的评估机制,那就是识别的准确率,而这项指标在20世纪90年代中后期实验室研究中得到了不断的提高。比较有代表性的系统有:IBM公司推出的ViaVoice和DragonSystem公司的NaturallySpeaking,Nuance公司的NuanceVoicePlatform语音平台,Microsoft的Whisper,Sun的VoiceTone等。

其中IBM公司于1997年开发出汉语ViaVoice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice'98。它带有一个32,000词的基本词汇表,可以扩展到65,000词,还包括办公常用词条,具有“纠错机制”,其平均识别率可以达到95%。该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统。

国内研究

我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。

清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。

中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。

科大讯飞(股票代码:002230)目前拥有国际领先的连续语音识别技术,识别准确率超过95%,语音输入速度达180字/分,识别结果响应时间低于500ms。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
电池管理系统(BMS)到底在管理哪些东西?
BMS是Battery Management System首字母缩写,电池管理系统。它是配合监控储能电池状态的装置,主要就是为了智能化管理及维护各个电池单元,防止电池出现过充电和过放电,延长电池的使用寿命,监控电池的状态。一般BMS表现为一块电路板,即BMS保护板,或者一个硬件盒子。
用户8913398
2023/09/06
11.4K0
电池管理系统(BMS)到底在管理哪些东西?
两轮电动补能升级,“换换”开辟智能换电新赛道
近来接连发生的“电池自燃”事件,极大地加剧了普通消费者对于电动车安全的担忧。相对于四轮车来说,两轮车面临的问题则更加复杂,它不仅要面临来自电池安全方面的挑战,还需要面对行业供需失衡带来的充电难、续航短等现实困扰。这种情况下,能有一个兼顾安全以及续航里程的两轮车充换电解决方案就显​得尤为重要。
刘旷
2021/08/27
3810
两轮电动补能升级,“换换”开辟智能换电新赛道
​电量计基础知识介绍:
包含电芯、电量计IC、保护IC、充放电MOSFET、保险丝FUSE、NTC 等元件。一级保护IC 控制充、放电MOSFET,保护动作是可恢复的,即当发生过充、过放、过流、短路等安全事件时就会断开相应的充放电开关,安全事件解除后就会重新恢复闭合开关,电池可以继续使用。一级保护可以在高边也可以在低边。二级保护控制三端保险丝,保护动作是不可恢复的,即一旦保险丝熔断后电池不能继续使用,又称永久失效(Permanent Failure, PF)。电量计IC采集电芯电压、电芯温度、电芯电流等信息,通过库仑积分和电池建模等计算电池电量、健康度等信息,通过I2C/SMBUS/HDQ 等通信端口与外部主机通信。
徐师兄
2022/12/19
2.2K0
​电量计基础知识介绍:
新能源汽车的充电
内容包括新能源汽车的电池包介绍,铅酸电池如何在化学能与电能间转换,充电设备概述,结合电路详述新能源汽车的交流与直流充电等。持续更新,原创不易!
爱上电路设计
2023/09/06
1.1K0
新能源汽车的充电
只靠石墨烯电池,革新不了两轮电动车
雅迪、爱玛、台铃等都有搭载石墨烯电池的车型,雅迪的TTFAR石墨烯电池已经迭代到第4代,而第3代Plus电池搭载在冠能3 E9 PRO上完成量产上市;爱玛、台铃都和电池厂商超威建立了长期合作关系,为自家车型提供石墨烯电池。
用户2908108
2023/02/26
6890
只靠石墨烯电池,革新不了两轮电动车
电动两轮车又要洗牌了
2020年,一场疫情的突然袭击,让无数行业应声倒下,但两轮车市场却在这场空前的“危局”中逆势“反杀”,销量持续飙升。与此同时新国标的持续推进,也让两轮电动车市场完成了一次市场出清。
刘旷
2021/08/30
2620
电动两轮车又要洗牌了
BMS开发-电池简介
当对电池进行充电时,电池的阴极上有锂离子生成,生成的锂离子经过电解液运动到阳极。而作为阳极的碳呈层状结构,它有很多微孔,到达阳极的锂离子就嵌入到碳层的微孔中,嵌入的锂离子越多,充电容量越高。
用户8913398
2024/04/29
2970
BMS开发-电池简介
5V升压8.4V,5V转8.4V电路图FS5282芯片做锂电池充电IC短路保护
FS5282作为一款专为多串锂电池或磷酸铁锂电池设计的升压充电管理集成电路,凭借其高效、灵活、稳定的特性,在便携式设备、储能系统、电动工具等领域展现出显著优势。其核心设计理念是通过集成化方案简化外围电路,同时支持5V供电升压至多串电池所需电压,极大降低了系统设计的复杂度与成本。以下从工作原理、功能特性、应用设计及市场价值四个维度展开深度解析。FS5282是一款可使用5V供电升压充多串锂电池的集成管理电路。FS5282非电池或磷酸铁锂电池充电管理,外置 NMOS 和根据充电电流大小选择不同功率 MOS,外围元用简单。FS5282 具用涓流、恒流、恒压充电模 式,非常适合锂电池或磷酸铁锂电池的充电。恒压充电值由外部分压电阻网络设置,恒流充电值通过外部检流电阻阻值设置。对于深度放电的电池,电池电压低于涓流充电阀值时用设置恒流充电时的 15%对电池涓流充电。在恒压充电阶段,充电电流逐渐减小,当充电电流减小到恒流充电的 10%时判定为电池充饱。常适合对多串锂件少应输入电压 4.5V-6V恒压充电值由外部分压电阻设定SOP8 封装升压充电转换效率恒流充电值由外部检流电阻设定外置功率 MOS 升压开关频率 250KHz充电状态和充饱指示状态软启动功能工作温度-40℃到+85℃采用常用的产品无铅、无卤元素,满足 RoHS90%⚫ 输入自适应功能唱戏机 扩音器 蓝牙音响POS 机 电动工具 各类多串锂电池应用产品 FS5282
泛海微电
2025/04/24
1100
牛人拆解特斯拉Model S电池,它到底强在哪里?
国外牛人直接给我们展示电池组。电池组安放前后轴之间的底盘位置,其重量可达900公斤。因此造成底盘重心较低,非常利于车辆的高速稳定性。电池组几乎占据车辆底盘的全部,但电池组并没有作为承受力的主题,电池组
机器人网
2018/04/25
7460
牛人拆解特斯拉Model S电池,它到底强在哪里?
两轮电动车能源技术的“半子”之争
作者 | 曾响铃 文 | 响铃说(xiangling0815) 灼热的气温再次加剧了人们对气候问题的担忧,低碳经济的重要性被40度的高温再次放大,能源技术的创新已经刻不容缓。 而这其中,被很多人忽视的两轮电动车的能源技术快速进化,行业布局多年,出现了一大批成果,集中表现为各种电池产品的创新与迭代。 不久前,行业头部玩家雅迪就举办了一场能源科技大会,正式对外公布了在能源技术上的最新成果——雅迪TTFAR石墨烯4代电池,行业首发三年质保,同时现场对其TTFAR石墨烯3代Plus电池、TTFAR碳纤维2.0锂
曾响铃
2022/08/29
2740
两轮电动车能源技术的“半子”之争
聊聊身边的嵌入式,来去如风的电动自行车
电动自行车上世纪80年代末发源于日本,最初是为了减轻骑行者的劳累感,采用的是动力辅助系统PAS(Power Assist System)。它的一个比较关键的部件是力矩传感器,通过感知脚踏力量的同时,调节电机输出力矩的大小,从而使骑行者省力。电动助力车的电机,一般采用中置的方式,就是安装在自行车中部脚踏的牙盘,然后通过减速齿轮和链条传动给后轮。这种自行车平衡性和操控性都比较好,但是结构复杂,成本高。
用户2366192
2021/05/31
8000
28万的特斯拉,说拆就拆
据台媒报道,7月22日上午,艺人林志颖驾驶一辆白色特斯拉Model X意外发生车祸,车辆头部撞击后燃起熊熊大火。所幸林志颖与车上的儿子及时离开车辆,二人并无生命危险。
AI 电堂
2022/12/08
6840
28万的特斯拉,说拆就拆
特斯拉为何这么牛?完整的电池板全拆解让你不服不行
时尚的外形、百公里加速3.2秒、续航440公里,这些都是特斯拉Model S作为一款纯电动汽车所展示给人们的数据。 Model S之所以能够拥有不逊于传统燃油车的性能表现,除了电动机技术之外,还要得益
机器人网
2018/04/24
1.2K0
特斯拉为何这么牛?完整的电池板全拆解让你不服不行
长篇好文,手机电池充电、放电架构与工作流程讲解
电池充放电电路是手机中最关键的电路之一,是手机一切功能的源头,如果该电路出现问题会使得整个手机工作不稳定, 甚至无法开机。手机的电是从电池来的,电池电压经过电源管理IC后,输出到各个负载,这个电源管理芯片叫做PMIC,Power Management IC ,比如下图所示,电池的电经过PMIC后转换为一个叫做system的电,这就是手机的主电源,这个电源有的平台叫Vsys,有的平台叫VPH_PWR,总之万事万物都是想通的,不管叫什么电,手机来其他模块的电都是从这路电转换而来的,高端手机里有上百路电源,低端手机也有林林总总六七十路电源,都是从Vsys来的。
工程师看海
2022/06/23
1.4K0
长篇好文,手机电池充电、放电架构与工作流程讲解
隐秘历史:搞出一辆我们自己的电动车,要经历怎样的磨难?
这个世界里,齿轮飞速啮合,轴承兀自旋动,无休止的数据如土豪的消费账单一样从屏幕里喷涌而出。
浅黑科技
2021/07/20
6030
AHBC-CANB500霍尔电流传感器用于高精度电流监测
AHBC-CANB电量传感器为一高精度直流电流传感器,主要安装于电池组 母排,用于监测充放电电流。AHBC-CANB采用磁通门技术,具有高精度,低 磁滞等优点。零点偏置电流小于10mA,由于采用磁通门原理,无磁滞影响,在 1000A大电流冲击后仍能保持低零偏,高精度特性。因此特别适用于动力电 池电量监测,高精度电流监测等应用场合。电池电流监测及管理系统。 磁通门原理在高精度测量领域具有绝对的技术优势,采用激励磁场持续振 荡,可等效于消磁磁场,进而使磁滞降到。 国标QCT 897-2011中第4.2.4条目规定SOC估算精度要求不大于10% 。 为保证该精度,充放电监测精度需优于1%,为保证大电流,小电流场合下均 有高精度SOC,传感器满量程精度需尽一步提高至0.3%。AHBC-CANB电量 传感器满足该精度要求,并且具有更小的磁滞及更小的零点偏移。
11qqq22233ffff
2023/11/14
2020
AHBC-CANB500霍尔电流传感器用于高精度电流监测
高举高打快速渗透77个国家,雅迪电动能成为两轮界的“华为”吗?
近期,路透社、华盛顿商业周刊在内的一大波外媒,集中报道了中国电动车品牌雅迪在意大利米兰国际摩托车展上发布的一款面向高端市场的智能锂电两轮车G5。这款售价3299欧元(约合人民币26000多人民币)的电动两轮车也迅速引起了笔者的关注。近两年像华为、小米、雅迪、比亚迪等这类中国企业频频出击海外引发外媒的关注,不难发现,国内市场已经难以满足“中国智造”品牌的“胃口”了。
用户2908108
2018/12/18
5430
可穿戴设备——电源模块
电源作为能量存储容器,在日常生活中具有广泛的应用,例如:新能源汽车、手机电脑以及可穿戴设备等,如何提高电池的安全性能,降低电源输出电压的波动幅度,于此同时如何进一步的提高电池的使用效率和寿命,是电池管理系统(BMS)的核心要素;本推文对可穿戴设备相关的电源模块进行归纳汇总,并且附件中对BMS系统进行了简要的介绍,具体内容如下~
联远智维
2022/01/20
5250
可穿戴设备——电源模块
BMS(电池管理系统)第一课——BMS系统框架简介什么是BMS?
对于锂离子电池,其理想的工作范围受限很大,并不宽泛.因此,锂离子电池在应用过程中必须进行管理,尤其在动力电池的应用场景下.
233333
2021/09/14
3.7K0
BMS(电池管理系统)第一课——BMS系统框架简介什么是BMS?
两轮电动车,开不出「老城」
自进入2022年以来,国内油价历经六轮调整,结果轮轮上涨,95号汽油全面突破9元,稳居高位,所带来的连锁效应已持续影响着各方市场的浮动。
用户2908108
2022/05/17
2880
两轮电动车,开不出「老城」
推荐阅读
相关推荐
电池管理系统(BMS)到底在管理哪些东西?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档