首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据万象音视频处理 —— 打开对声音的想象,开启AI创作时代

“前方路口请直行”、“限速100”、“前方路段拥堵”等,是不是看到这些导航常用语句,脑海中已经有您常听的声音浮现了?导航播报所使用的TTS语音合成技术的商业化道路从有声听书、银行智能客服覆盖到虚拟人配音、残障人士辅助应用等,用户需求来源多样,应用场景逐步细化和专业,在这众多的行业所孕育出的应用场景中,TTS语音合成技术大幅减少文字转为语音的时间与企业用工成本的同时,也为用户带来由AI创作赋予的全新体验,语音合成模型经过长时间的发展,由最初的基于拼接合成,到参数合成,逐渐达到了感情充沛、高流畅度、个性化的现阶

01
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    系统调研450篇文献,微软亚洲研究院推出超详尽语音合成综述

    编者按:语音合成一直以来是语言、语音、深度学习及人工智能等领域的热门研究方向,受到了学术界和工业界广泛的关注。尽管语音合成技术的研究已有几十年的历史,基于神经网络的语音合成技术也有近十年历史,且已产出了大量的优质研究成果,但针对神经语音合成不同研究方向的整合型综述论文却十分匮乏。近日,微软亚洲研究院的研究员们通过调研了450余篇语音合成领域的文献,发表了迄今为止语音合成领域几乎最详尽的综述论文 “A Survey on Neural Speech Synthesis”。在文中,研究员们还整理收集了语音合成领域的相关资源如数据集、开源实现、演讲教程等,同时也对语音合成领域未来的研究方向进行了探讨和展望。希望本文能对相关工作的研究人员提供具有价值的参考。

    02

    用python实现自己的小说阅读器

    前一段时间书荒的时候,在喜马拉雅APP发现一个主播播讲的小说-大王饶命。听起来感觉很好笑,挺有意思的,但是只有前200张是免费的,后面就要收费。一章两毛钱,本来是想要买一下,发现说的进度比较慢而且整本书要1300多张,算了一下,需要200大洋才行,而且等他说完,还不知道要到什么时候去。所以就找文字版的来读,文字版又有它的缺点,你必须手眼联动才行。如果要忙别的事情,但是又抑制不住想看的冲动,就很纠结了。在网上找了一圈,没有其他的音频。而且以前用的那些有阅读功能的软件,比如微信阅读、追书神器也都开始收费了。那怎么办呢?这能难倒一个程序员吗?必须滴、坚决滴不能。我用的可是世界上最好的编程语言-Python

    02

    项目实战 | 手把手做一款小说阅读器

    前一段时间书荒的时候,在喜马拉雅APP发现一个主播播讲的小说-大王饶命。听起来感觉很好笑,挺有意思的,但是只有前200张是免费的,后面就要收费。一章两毛钱,本来是想要买一下,发现说的进度比较慢而且整本书要1300多张,算了一下,需要200大洋才行,而且等他说完,还不知道要到什么时候去。所以就找文字版的来读,文字版又有它的缺点,你必须手眼联动才行。如果要忙别的事情,但是又抑制不住想看的冲动,就很纠结了。在网上找了一圈,没有其他的音频。而且以前用的那些有阅读功能的软件,比如微信阅读、追书神器也都开始收费了。那怎么办呢?这能难倒一个程序员吗?必须滴、坚决滴不能。我用的可是世界上最好的编程语言-Python

    02
    领券