首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Linux下利用python实现语音识别详细教程

    语音识别源于 20 世纪 50 年代早期在贝尔实验室所做的研究。早期语音识别系统仅能识别单个讲话者以及只有约十几个单词的词汇量。现代语音识别系统已经取得了很大进步,可以识别多个讲话者,并且拥有识别多种语言的庞大词汇表。 语音识别的首要部分当然是语音。通过麦克风,语音便从物理声音被转换为电信号,然后通过模数转换器转换为数据。一旦被数字化,就可适用若干种模型,将音频转录为文本。 大多数现代语音识别系统都依赖于隐马尔可夫模型(HMM)。其工作原理为:语音信号在非常短的时间尺度上(比如 10 毫秒)可被近似为静止过程,即一个其统计特性不随时间变化的过程。 许多现代语音识别系统会在 HMM 识别之前使用神经网络,通过特征变换和降维的技术来简化语音信号。也可以使用语音活动检测器(VAD)将音频信号减少到可能仅包含语音的部分。 幸运的是,对于 Python 使用者而言,一些语音识别服务可通过 API 在线使用,且其中大部分也提供了 Python SDK。

    05

    声纹识别技术:安全指数更高但其发展仍面临重重阻碍

    在众多生物识别技术中,除了早已使用多年的指纹识别、虹膜识别,近期兴起的人脸识别技术被用于公司打卡、软件系统登录、家庭或公共场所的安防等多个场景,而语音识别技术的用途更是广泛,机器人、智能家居产品、无人车等等。 随着相关算法的精进,以上生物识别技术的准确率已经可以与人类相媲美。而在这些识别技术愈加成熟之时,越来越多的人将目光放在另外一种生物识别技术上——声纹识别。 什么是声纹识别技术? 声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术。人在讲话时使用的发声器官舌、牙齿、喉头、肺、鼻腔在尺寸和形态

    06

    【专访微软黄学东】0.1%,0.2%与0.3%,语音识别军备竞赛中小数点差距有何意义

    【新智元导读】 微软语音识别研究团队在黄学东的带领下,去年将语音识别的单词错误率降至5.9%,又在最近降至5.1%。在本次专访中,我们讨论了语音识别错误率百分之几的小数点在研究和实际应用上的意义。黄学东认为,从研究角度来说,这个意义十分重大,即便是0.1%的差距,无论是运算量还是时间,耗费都是巨大的。 达到人类水平,超越人类水平,人工智能研究领域的突破性进展。 以上赞誉被给予了微软最近的语音识别研究成果:其语音识别研究团队在黄学东的带领下,去年将语音识别的单词错误率降至5.9%,又在最近降至5.1%。 从研

    07

    灵云平台上线藏、彝、蒙、朝鲜语音识别SDK

    继推出维吾尔语、粤语识别,近期,捷通华声联合中国民族语文翻译局,推出藏、彝、蒙、朝鲜语语音识别技术,为藏族、彝族、蒙古族、朝鲜族同胞的日常办公、沟通交流提供语音识别服务。 民族语言识别 为企事业单位办公、民众交流提供便利 灵云语音识别技术,已广泛应用于国内的企事业单位会议、公检法、医疗等领域。 通过应用灵云藏、彝、蒙、朝鲜语语音识别技术,少数民族企事业单位可以应用语音识别技术,识别日常工作会议发言,快速生成会议记录;地区公安、检察、法院等政法机构可以应用语音识别来转写办案过程中的讯问发言,快速生成办案笔录;

    04

    思必驰俞凯:自然语言技术的畅想关键点不在交互,而是自然丨清华人工智能研习社

    大数据文摘作品 大数据文摘记者 刘涵 魏子敏 “自然语言技术的未来,其关键点是“自然”两个字。” 11月最后一天,思必驰联合创始人、首席科学家俞凯博士在清华x-lab主办的人工智能研习社第七课上,如此评价自然语言处理,并与现场听众一起畅想了这一潜力巨大的技术将走向哪里。 图:11月30日,思必驰联合创始人俞凯在清华做了题为《认知型口语对话智能》的讲座。 刘涵 摄 在这场题为《认知型口语对话智能》的讲座上,俞凯认为认知交互面临的最主要的挑战一定不是语音,因为从语音识别的角度上来说,问题明确,只要专门向这个领

    02
    领券