前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >你听不出是AI在唱歌!这个日本虚拟歌姬,横扫中英日三种语言

你听不出是AI在唱歌!这个日本虚拟歌姬,横扫中英日三种语言

作者头像
量子位
发布于 2018-12-28 04:15:27
发布于 2018-12-28 04:15:27
1.6K0
举报
文章被收录于专栏:量子位量子位
郭一璞 晓查 乾明 发自 凹非寺 量子位 出品 | 公众号 QbitAI

在今天的内容开始之前,大家可以先戳下面的声音听一下,不长,只有18秒,是一个妹子在唱Adele的知名歌曲Rolling in the Deep。

有熟悉二次元世界的盆友可能听出来了,这段歌声听起来像佐藤莎莎拉,她是声音编辑软件CeVIO开发的虚拟歌姬。

不过,莎莎拉本尊的声音似乎听起来更“电子”一些,而上面这段Rolling in the Deep听起来就好像是一个声音和莎莎拉一样的真人唱的。

并不。

事实上,这是日本语音合成技术的最新突破,只要时长2小时的某歌手的歌声数据,通过深度学习技术,就可以合成出跟这个人一模一样的歌声。

如此真实的莎莎拉声音,让微博上的二次元粉丝惊呼:我的老婆要重生了!

甚至还有人已经预料到了,这将颠覆鬼畜圈。

嗯,以后B站UP主们就可以让丞相非常自然的唱骂王司徒了。

而在音乐界,这个新技术能让我们欣赏更多不同的歌曲。

举个例子,只要让AI听林俊杰的三张专辑,AI就可以用林俊杰的声音,唱出周杰伦、五月天、孙燕姿他们的任何一首歌。

并且,你会完全听不出电子合成的痕迹。

那下面,我们来欣赏一下这个AI在唱日文、英文、中文歌的不同表现吧:

日文版

前后分别是《Diamonds》和《瞳》两首歌,你可以依次听到每首歌带伴奏的完整版、清唱版和以前的技术生成的旧版本。

可以清晰的听出来,新技术生成的版本几乎和真人唱歌一模一样,完全没有旧版本那种浓浓的电子音。

英文版

英文歌则是《Rolling In The Deep》和《Everytime》两首,三个版本的顺序和上面的日文版相同。

英文版的清唱已经听起来跟正常人类唱歌没什么区别了,带上伴奏会有一丝丝违和,但单词的发音已经比旧技术的版本清晰多了。

不过,如果你仔细听了带伴奏的版本,会发现相比日文歌,这个AI在唱英文歌的时候还是有一丝丝电音的感觉。

中文版

终于到中文歌了,中文歌是陈奕迅的《爱情转移》。

这位AI唱中文歌的特点,就是一个字一个字的蹦,可能日本人民就是这么学中文的吧。

不过,仔细听还是可以听出它的潜质的,至少“让上次犯的错反省出梦想”最后一个字“想”,这个长音还是足够婉转的。

后一句“做爱情代罪的羔羊”,简直沙哑出了真人的感觉,看来AI已经了解到,这种突然变高的声音,普通人类是唱不上去的。

看来,要想学得像,也要学人类缺点啊,至少比旧技术那种强行飙高音的假唱听着舒服多了。

这背后是谁?

开发CeVIO的Techno Speech是一家的是由名古屋工业大学投资的创业公司,成立于2009年11月,主要业务是向外界提供计算机多媒体软硬件。

除了在资本层面,这家公司也和学校有着千丝万缕的联系,Techno Speech成立的目的正是传播名古屋工业大学开发的世界上最先进的音频相关技术。

名古屋工业大学语音技术研究室的德田惠一教授主导开发了以上项目,而从他实验室走出的大浦圭一郎博士正是Techno Speech的代理董事。

Techno Speech社长 大浦圭一郎

这次合成的声音用的是Techno Speech的CeVIO语音合成软件。

除此之外,这家公司还开发了其他一些知名的产品。

Techno Speech和日本卡拉OK公司Joysound合作,希望AI不仅能学会唱歌,将来还能教会人类唱歌。它不同于一般的用原唱声,而是实时合成语音,目前已经支持几乎所有日文歌曲。

大名鼎鼎的软银Pepper机器人也用上了他们的技术,他们曾获得过2017年“健康王国 for Pepper”机器人应用挑战赛大奖。

Pepper机器人装上他们的应用程序后,可以实现机器与人合唱,还能在唱完歌后给进行评论。

Techno Speech希望用这项技术解决养老院的娱乐设施问题。

使用了什么技术?

这一进步背后的技术细节,名古屋工业大学的研究团队没有透露,但表示明年3月,德田惠一团队将会在的日本声学学会春季会议上发布研究成果。

不过,在接受数码音乐网站DTM Station采访时,德田惠一也透露了一些细节:这个系统使用的是深度神经网络技术(DNN)。

德田惠一教授

在德田惠一自己的主页上,有很多语音合成的论文记录。最近也有一篇,刚好跟DNN有关。

在提到与日本版微软小冰“玲奈”的对比时,德田惠一称,微软的“玲奈”是从“歌词和歌声”到“歌声”,采用的是应对模拟用户的唱歌方法,而他们的这个,完全是歌词和乐谱结合来合成歌声。

此外,据介绍这项技术未来可以运用到下面8个领域:

  • 复现歌星的歌声(包括死者的声音)
  • 音乐制作和游戏开发
  • 由虚拟YouTubers主持的视频流/直播
  • 虚拟演员后期录制系统
  • AI或语音对话系统的发声模块
  • 生成灵活的参考语音,用于外语学习或歌唱教育
  • 为ALS(渐冻人症)或喉癌患者制作语音设备
  • 制作护理设施的数字标牌

专家解读“AI合成歌声”

关于这件事,量子位也请教了一些业内专家大神。

小冰首席语音科学家栾剑说,他听了CeVIO的演唱版本,日文和英文上的发音还不错,比较亲切,但更关注的是训练时间。

栾剑也看了CeVIO在B站的案例,不过觉得可能不是2小时的训练成果。一般来说,数据量越小,出高质量合成的难度越大。

今年,小冰六代发布会上,微软发布了一个4小时训练后的模型,当时效果反响不错。

但这位小冰首席语音科学家也强调,对于唱歌的评价更偏主观,不同人有不同的评价,所以评价标准并不统一。

如果以如何把人类的情感模拟到极致来看,栾剑则认为技术挑战在情感

“唱歌跟说话不同,对情感表达的要求非常高,嗓音、气息都会影响到最后的效果,所以如何更具情感是唱歌合成的难点。”

除了小冰,AI语音公司思必驰去年也在央视《机智过人》节目中亮相过AI唱歌项目。

思必驰联合创始人、首席科学家俞凯当时对AI合成歌声系统有过解读。

歌声合成是语音合成领域的一个分支,是给定文字和乐谱,生成唱歌语音的过程。

主体方法是在文字到语音合成的基础上,通过乐谱给定每个“汉字”的音调和“汉字”的发音长短,汉字以不同的音调合成出来就变成了歌唱。

唱歌模型是在朗读模型的基础上,通过改变声调实现文字与旋律的配合,并进一步利用深度学习去学习同一说话人演唱歌曲和朗读歌词之间频谱特征的差异。

标贝科技CTO李秀林告诉量子位,就目前的发展状况来看,AI合成歌声还有一些挑战。

这位TTS领域的大牛,曾是百度T9,因语音合成拿到百度年度最高奖,后来在滴滴任职语音团队负责人,在语音合成领域履历赫赫。

李秀林认为挑战有两点:

一方面是音域的限制,每个歌手都有适合自己的音域范围,如果超出范围的歌曲,合成效果可能会受到一定的影响。

另外,训练数据的限制,会影响基于神经网络的模型效果。

但新系统的效果与之前相比,有了很明显提升,机器声的感觉大幅下降,更接近真人的嗓音。

One More Thing

目前,国内AI唱歌最知名的还是微软小冰。

自2016年小冰以歌手身份出道以来,已发布了十几首接近人类质量的单曲。2017年9月底,第五代小冰解锁了人工智能歌手深度学习模型,还放下狠话:

我冲击的不是人类,而是传统的虚拟歌手。人类们,忘了漫长辛苦的手工调教吧。

一时反响激烈。

这一次,各方评论也纷纷提到了微软小冰。

不过小冰首席语音科学家栾剑也说,因为CeVIO没出中文版,所以跟最新的小冰六代还难以直接比拼。

但小冰团队对自家“女儿”非常自信,他们更希望让小冰直接唱给大家听。

因为公众号图文视频数量的限制,无法在此呈现了。

在量子位公众号对话界面回复“小冰唱歌”,给你听4小时训练后小冰六代的歌声。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
PPT背景图怎么换?学会这两招就够了
1、点击进入“插入”界面,然后点击“形状”选择“矩形”。然后在幻灯片中插入一个矩形,将矩形调整至与幻灯片一致大小。
高效办公
2019/09/30
2.1K0
PPT背景图怎么换?学会这两招就够了
PPT背景图怎么设置?3招教你轻松搞定
PPT背景图怎么设置?我们在生活中经常会用到PPT,一个精美的PPT可以给人留下深刻的印象。那么PPT中最为突出的就是PP背景图,但是我发现有很多人还不会设置PPT背景图。还在用最初的纯白背景。那么今天就分享这三个PPT背景图设置的方法,3招教你轻松搞定哦。
高效办公
2019/07/30
9250
PPT背景图怎么设置?3招教你轻松搞定
PPT模板怎么做?具体方法都在这儿
在“视图”界面点击进入“幻灯片母版”。然后点击页面中的“背景样式”,点击“设置背景格式”。然后点击填充为“图片或纹理填充”,添加图片并调整其透明度。点击“应用到全部”就可以了。
高效办公
2019/10/08
1.2K0
PPT模板怎么做?具体方法都在这儿
PPT背景颜色怎么修改?介绍四种修改方法
2、然后在“设置背景格式”界面中,点击填充为“纯色填充”,然后点击“颜色”图标修改背景颜色就可以了。
高效办公
2019/09/11
17K0
PPT背景颜色怎么修改?介绍四种修改方法
PPT模板怎么导入?你必须试试这两招
我们在制作PPT时候需要套用一些模板。这样我们只需要修改文稿中的文字内容就可以制作完成PPT了。不仅可以节省时间,还能让我们的看起来PPT更加高大上。那么PPT模板怎么导入呢?大家不妨试试这两种方法。
高效办公
2019/10/23
7.9K0
PPT图片形状怎么改?三个简单方法轻松搞定
1、在 “插入”界面中,点击“图片”将图片素材插入幻灯片。然后点击“形状”在幻灯片中插入你需要的形状,将形状调整与图片一致大小。
高效办公
2019/09/12
21.1K0
PPT图片形状怎么改?三个简单方法轻松搞定
【技能】手把手教你用PPT排版免疫组化图
免疫组化或者免疫荧光常常用到放大效果,先给出一个大视野的整体图,然后放大一定倍数找到一个比较合适的小视野,来展示某个特征部位的细节。说起来比较抽象,直接上图,也就是说我们今天要通过PPT获得下面的图形效果:
百味科研芝士
2019/11/28
4.7K0
PPT背景音乐怎么一直播放?大神手把手教你
我们在自己制作PPT的时候,可以尝试着给PPT添加背景音乐。这样不仅可以让你的PPT看起来更加高大上,还可以吸引观赏者。那么PPT背景音乐怎么一直播放呢?大家可以学习下面的具体操作方法。
高效办公
2019/10/21
4.8K0
PPT背景音乐怎么一直播放?大神手把手教你
PPT如何打造了若指掌的可视化图表
平时办公用户经常在PPT中插入图表,但是使用默认的图表可视化效果并不佳。其实可以结合PPT里的形状、图片和图表等元素,打造出可视化效果更佳的图表。下面就同iSlide一起来了解下吧!
纸醉金迷i
2021/12/20
2.2K0
PPT如何打造了若指掌的可视化图表
用幻灯片来汇报数据分析结果,导入导出功能是亮点
已经给大家介绍过了非常多的分析数据、观察数据和探索数据的操作和手段,今天就给大家详细介绍一个用于汇报展示数据分析结果的功能操作——幻灯片,以前大家接触的都是WPS中的PPT展示,而我们今天要说的是数据分析工具当中的PPT,要说这两种PPT 是一样的,其实也不违和,都是用于展示结果汇报,但其更多更好用的细节,接下来由我来阐述。
用户7220666
2020/04/30
3K0
怎样用ppt制作动画效果
PowerPoint可分别针对整张幻灯片和每张幻灯片中的各类元素进行动画效果设定。对于整张幻灯片的动画效果,PowerPoint2003提供了丰富的切换效果样式,可以在“幻灯片切换”任务窗格面板中,对选定的(或是全部)幻灯片直接进行套用,并且还能设定切换时的速度、声音和切换方式,接下来同iSlide一起来了解一下。
纸醉金迷i
2021/12/22
3.1K0
怎样用ppt制作动画效果
一种用markdown写PPT的方法,再也不用费劲排版了
今天看jeremyxu 的技术点滴,发现分享了一个 markdown 写 PPT 的插件,惊为天人,先来看看官方效果图。
机智的程序员小熊
2020/06/23
4.5K0
一定要试一试的实用PPT技巧
不管是什么软件和工具,平时多掌握一些技巧方法,在关键时刻能起很大作用,熟练运用后也能够帮助我们提高工作的效率。PPT也是如此,想要快速制作完成一个精美的PPT幻灯片,一定是需要用到很多的小技巧的。今天iSlide就来给大家分享几个很实用的PPT技巧。
纸醉金迷i
2022/02/22
3.3K0
一定要试一试的实用PPT技巧
PPT文件怎么压缩?以下几种方法供参考!
制作PPT的幻灯片文件时,文件可能相当大,对于部分用户来说,可能需要对其进行一定的压缩,其实,造成PPT文件过大,大部分是由于图片过大而造成的,我们只需要对图片进行压缩,就能帮助用户减小PPT文件的大小,想必部分刚入手的还不知道如何操作。
你人真好
2019/03/22
8410
利用PPT如何设计制作创意相框
很多人都希望自己的PPT能够独具匠心,在展示图片或制作电子相册时,总想让图片有个新颖、独特的相框,而PPT自带的图片边框显得“力不从心”。如果利用自选图形,再经过边线及内部填充等设置,就能够制作出具有创意效果的相框。下面iSlide就讲述微立体相框和水晶相框的制作技法。
纸醉金迷i
2022/01/27
4.2K0
利用PPT如何设计制作创意相框
5不起眼的PPT小技巧,帮你省下一半的时间
在我们办公的时候,经常是会用到PPT的,每次看到别人做的PPT又快又好,心里既羡慕,又着急,自己怎么弄都弄的不好,那是因为你没有掌握这5不起眼的PPT小技巧,今天呢就来给大家说说这5超级好用的PPT技巧,帮你省下一半的时间哦。
高效办公
2019/05/09
7940
5不起眼的PPT小技巧,帮你省下一半的时间
听说你还在花钱从网上买 PPT 模板?
这里有海量 PPT 素材、幻灯片背景图片、PPT 模板供你选择下载。资源分类丰富,主要分为以下几个大类:
村雨遥
2022/06/27
5500
听说你还在花钱从网上买 PPT 模板?
【技巧】文字探照灯 PPT也能做
在使用PPT制作演示文稿时,往往想给自己的内容加上一些特殊效果以吸引人的眼球,比如想对文字进行“探照灯式”的扫描,灯光扫描到的文字在光柱下显示,没有扫描到的的文字漆黑一片看不到。这种效果在现有PPT自定义动画效果中是不存在的,无法用现成的效果调用来实现特效。虽然说用Flash制作那是非常简单的事,但不会用Flash的人还要从头学习,这太费时费力了。
若川
2020/03/19
1.5K0
Word字体间距怎么调?这里有三种方法可以帮到你
我们在Word中编辑文字的时候,可能需要对文档中的字体进行其他艺术效果的设置。那么我们有时候就需要适当的调整文档中的字体间距。那么Word字体间距怎么调呢?小编总结了三种方法,大家可以参考一下。
高效办公
2019/11/07
2.8K0
Word字体间距怎么调?这里有三种方法可以帮到你
PPT中怎样批量替换字体?
  对于PPT的制作同样的时间同样的题材为什么别人的就是比自己做的好看?并且大佬们耗时还很短,这就很纳闷。其实是大佬们掌握了更多制作PPT的技巧,并进行熟练使用从而可以快速制作出好看的PPT,那在PP
纸醉金迷i
2022/02/25
2.6K0
PPT中怎样批量替换字体?
推荐阅读
相关推荐
PPT背景图怎么换?学会这两招就够了
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档