李杉 编译自 Recode 量子位 报道 | 公众号 QbitAI 如果谷歌想继续成为主导全球的信息来源,就需要确保人们能够在各种情况下继续使用谷歌产品。为了达成这个目标,他们越来越重视语音服务。 各大硅谷巨头都在争相发展语音领域,而在搜索和语言领域拥有专业技术的谷歌有望占据领先地位。 但谷歌起步较晚。该公司在硬件领域姗姗来迟,苹果Siri依托于iPhone,亚马逊Alex依托于Echo设备,而且都已经在消费普及方面取得了明显的领先优势。 为了充分掌握语音技术,谷歌必须使用这种对广告主及其主营业务不太友
AI科技评论按:很多读者在思考,“我和AI科技评论的距离在哪里?” 答案就在文末。 图片来源:CNET AI科技评论按:在谷歌 I/O 2017大会开始之前,各大媒体就频频猜测Google Assis
【中关村在线新闻资讯】12月29日消息,谷歌本月推出了一款名为“Tacotron 2”的全新文字转语音系统,它具有惊人的发音准确性,且实际文本阅读效果几乎同真人声音无法区分。 📷 谷歌用AI合成语音(图片来自baidu) “Tacotron 2”其实已经是谷歌的第二代类似技术,它由两个深度神经网络组成。目前,该系统只进行了英语女声的训练(如要需要它发出男性声音的话,谷歌则需要对其进行重新“培训”)。 谷歌的研究人员表示,“Tacotron 2”完全可以准确发音一些非常复杂的单词和人名,并根据标点符号的不同而
在机器学习的推动下,像Alexa,谷歌助手这样的会话式AI只会越来越多,因为世界上最大的科技公司竞相将他们的助手放在你的家中,工作场所和汽车中。
利用深度学习做语音交互的开发者,很可能对两个谷歌的产品特别关心: 五月初,谷歌 AIY 项目(“Artificial Intelligence Yourself”)的首款产品——Voice Kit 面世。 Voice Kit 套件可借助 Google Assistant SDK 和 Cloud Speech API,将树莓派3 转换为语音数字助理。用户可在此基础上创建虚拟语音助手、为自己的项目添加语音交互功能。当时,在全球开售的几小时内,Voice Kit 就被抢光——这对谷歌而言是一个很强烈的信号。A
编辑导语 谷歌近日更新了Android Wear,引入三种功能,分别是新的手势控制、语音指令范围扩大以及语音通话。 谷歌近日更新了Android Wear,引入三种功能,分别是新的手势控制、语音指令范
【腾讯科技编者按】 据国外媒体报道称,如果按照最新的标准来看,人类似乎已经将自己的“声带”正式献给了人工智能。这可并不是笔者在这儿危言耸听,而是谷歌本月开创性地推出了一款名为“Tacotron 2”的全新文字转语音系统,它具有惊人的发音准确性,且实际文本阅读效果几乎同真人声音无法区分。 消息称,“Tacotron 2”其实已经是谷歌的第二代类似技术,它由两个深度神经网络组成。其中一个负责将文本转换为可视化的图谱(通常是PDF格式),然后再将这个生成的这个可视化图谱载入第二个深度神经网络WaveNet(这
【新智元导读】10月4日,谷歌举行新品发布会,发布了两款 Pixel 手机,VR产品 DayDream View 眼镜和三款智能家庭终端设备——Google电视棒的升级产品 Chromecast Ultra、Google WiFi路由器和对标亚马逊echo的Google Home等。其中Google Home最值得注意,使用了谷歌最新虚拟助手的这款产品带有两个颠覆意义:对智能家居行业的颠覆,以及对谷歌作为搜索公司本身的颠覆。 谷歌在10月4日的新品发布会上,发布了基于语音控制的家庭自动化操作控制中枢——Go
人工智能受到的关注越来越多,如今亚马逊、谷歌等科技巨头都拥有了自己的智能语音助手,并率先抢占智能家居、智能汽车等市场高地。
【新智元导读】《纽约时报》今日消息,谷歌有可能在即将举行的 I/O 大会上宣布进军家庭声控设备市场,推出一款叫 Google Home 的家庭语音控制设备。各大科技巨头都在围绕智能语音交互技术抢占所谓的“入口”,眼下谷歌如果要出牌,它会有什么动作呢? 北京时间 2016 年5月 18 日,据《纽约时报》报道,一名要求保密的线人透露,谷歌将在加利福尼亚当地时间周三举行的 I/O 大会上宣布进军家庭声控设备市场。 据悉,谷歌即将推出的这一设备的名字是 Google Home,将成为家庭中的虚拟代理人,可以回答
1.微软公司开发版全息眼镜HoloLens明年一季度将上市 科技日报北京时间12月21日电,据物理学家组织网近日报道,微软公司将于明年一季度推出其最新全息眼镜HoloLens。全息眼镜是一款增强现实(
什么一个开端。谷歌I/O 2019主题演讲结束了,但从头到尾感觉都像是一场力作。虽然我们的一些预测没有成真——我们将永远不会有像素手表吗?-最期待的谣言成真,这意味着我们遇到了一些理想的新硬件,包括中
如果你是谷歌云客户,并且正在使用该公司的AI套件来进行文字转语音或语音转文本服务,这有个好消息:谷歌今天宣布了这些方面的重大更新,包括云文本到语音的普遍可用性,优化声音以便在不同设备上播放的新音频配置文件,多声道识别的增强功能等等。
【新智元导读】作为Web 2.0概念的提出者之一,著名科技媒体O'Reilly出版社的 CEO Tim O'Reilly 在本文中谈了他对下一代用户界面的思考:亚马逊的Alexa证明,语音交互也能做得很好;但是,对话界面并不能解决所有的AI问题;未来人机交互将会是人与智能代理的交互,应用人性化的设计,将对话分解成更小的域,在这些域内,认真思考如何使用"fit and finish"原则 ,能够让界面直观、交互完整。 (文/Tim O'Reilly)每过一段时间就会出现一种产品,改变人们对用户界面可能性的期待
一个月前,谷歌宣布在源于Magenta项目的文字转语音(Text-to-Speech,简称TTS)技术上取得代际突破,接着该公司又对其语音转文字(Speech-to-Text,简称STT)API云服务进行了重大升级。更新后的服务利用语音转录的深度学习模型,根据特定用例量身定制:短语音命令、打电话或视频,在所有其他上下文中都有一个默认模型。如今,升级后的服务可以处理120种语言以及不同模型可用性和功能级别的变体。商业应用范围包括电话会议、呼叫中心和视频转录。转录的准确性在有多个扬声器和明显背景噪音的情形下有了
语音将会成为面向消费者和企业的下一个重要平台。本文分析了五大巨头如何抢占规模490亿美元的语音市场,五大巨头总计投资了38家人工智能语音企业,并陆续推出了智能音箱和语音助手等产品抢占市场!
最近自己想接触下语音识别,经过一番了解和摸索,实现了对语音识别API的简单调用,正好写文章记录下。目前搜到的帖子里,有现成的调用百度语音API来对音频文件进行识别的;也有通过谷歌语音服务来实现了实时语音识别的。由于我这谷歌语音一直调用不成功,就将二者结合,简单实现了通过百度语音API来进行实时语音识别。
谷歌5月8日在加州召开了 2018 年度的开发者大会(Google I/O 2018)。在大会介绍的 Android P、Gmail、Gboard、TPUv3 等众多新产品和功能中,尤为亮眼的无疑是个人助理 Google Assistant 中新增加的 Duplex,它可以自己给饭馆、发廊等商业店面打电话,帮用户预约时间。
AI 科技评论按:谷歌昨晚在加州召开了 2018 年度的开发者大会(Google I/O 2018)。在大会介绍的 Android P、Gmail、Gboard、TPUv3 等众多新产品和功能中,尤为亮眼的无疑是个人助理 Google Assistant 中新增加的 Duplex,它可以自己给饭馆、发廊等商业店面打电话,帮用户预约时间。
选自Google Blog 作者:Yuxuan Wang、RJ Skerry-Ryan 机器之心编译 参与:黄小天、李亚洲、李泽南 神经网络文本转语音(TTS)是自然语言处理领域的重要方向,很多谷歌的产品(如 Google Assistant、搜索、地图)都内置了这样的功能。目前的系统已经可以产生接近人声的语音,但仍然显得不够自然。在最近发表的两篇论文中,谷歌为自己的 Tacotron 系统加入了对韵律学的建模,以帮助人们利用自己的声音进行个性化语音合成。 最近,谷歌在基于神经网络的文本转语音(TTS)的研
Google的DeepMind研究实验室昨天公布了其在计算机语音合成领域的最新成果——WaveNet。该语音合成系统能够模仿人类的声音,生成的原始音频质量优于目前的文本转语音系统(text to speech,简称TTS)。 DeepMind宣称,通过人耳测试,该技术使得模拟生成的语音与人类声音之间的差异缩小了一半。当然,这种测试不可避免地存在主观性。 WaveNet目前还没有被应用到谷歌(微博)的任何产品中,而且该系统需要强大的计算能力,近期也无法应用到真实世界场景。 让人类跟机器自由交谈是人机交互研究领
近期谷歌在加州召开了 2018 年度的开发者大会(Google I/O 2018)。在大会介绍的 Android P、Gmail、Gboard、TPUv3 等众多新产品和功能中,尤为亮眼的无疑是个人助理 Google Assistant 中新增加的 Duplex,它可以自己给饭馆、发廊等商业店面打电话,帮用户预约时间。
谷歌发布了为汽车制造商提供的新安卓操作系统(Android OS),它的特色是与当前的汽车操作系统Android Auto相比,整合更深入。 谷歌已经和奥迪(Audi)、沃尔沃(Volvo)携手合作,从头开始打造安卓系统支持的汽车,该系统的特点是出厂内置谷歌助理(Google Assistant)。这可以让用户仅通过语音就能控制车内的一些功能,例如座椅的温度,还能使用流行应用程序,如谷歌地图(Google Maps)和源于瑞典的正版流媒体音乐服务平台Spotify。这次的公布也清楚地表明了谷歌为深入用户生活
大数据文摘授权转载自品玩 作者:吳越 12月伊始,传闻许久的亚马逊万人裁员计划,终于还是锁定了第一批对象。据英国《金融时报》报道,亚马逊决定首先精简的团队,分别来自Alexa语音助手及音箱,Kindle电子阅读器和Halo健康监测手环这三个设备。 其中,又以Alexa所在的部门人员最多,亏损最甚。Business Insider称,仅Alexa团队就有超万名员工,且团队2022年的亏损即将超过100亿美元。另据ABI Research的数据,亚马逊每售出一台Alexa设备都会损失数美元。以智能音箱Echo
机器之心原创 记者:CZ、Tony Peng 当地时间 5 月 17 日,谷歌在山景城开启了本年度的谷歌 I/O 开发者大会。昨日机器之心对此次大会上将出现的有关人工智能和机器学习的内容进行了梳理。机器之心作为谷歌官方受邀媒体来到现场,近距离为大家报道谷歌人工智能的最新进展。 从大会主题演讲可以看出,谷歌人工智能主要体现在以下五大方面: AI First 的整体战略; TPU 的升级与云服务; 集研究、工具、应用于一体的 Google.ai ; 人工智能技术的产品落地; 基于安卓和 TensorFlow 的
科技改变生活 近日,谷歌推出了新的语音合成系统Tacotron 2,这是一种直接从文本中合成语音的神经网络结构,即新型TTS系统,该系统结合了初代Tacotron和Deepmind WaveNet等研究的经验,在能力上有了进一步提升。 TTS技术即从文本到语音,它是语音合成应用的一种。在搭载神经网络算法的语音控制器作用下,文本输出的语音音律应使听众在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感,但是目前还没有一款系统可以做到。 📷 2017年3月,谷歌推出了一种新的端到端语音合成系统Tacotron。
据外媒报道,谷歌最近进行内部测试的一项新功能,是可以让用户在对Nest Hub智能显示屏发出指令前不需要说「hey Google」。
翻译 | AI科技大本营(rgznai100) 参与 | shawn 通过在人类听不到的频率上对他们进行耳语,黑客可以控制世界上最流行的语音助手。 中国的研究人员发现,苹果、谷歌、亚马逊、微软、三星和华为的语音助手都存在着可怕的漏洞。它影响了所有运行Siri的iPhone和Macbook,所有的Galaxy手机、所有运行Windows10的PC,甚至连Amazon的Alexa助手都受波及。 浙江大学的一个研究小组使用了一种叫做海豚攻击的技术,将典型的语音指令转换成超声波频率,这种频率对人类的耳朵来说太高
对攻击语音识别系统的研究表明,某些隐藏的语音命令人类无法听见,但是这些声音却可以控制系统。在最近的一些实验中,研究者设计了一个完全听不见的攻击:DolphinAttack,通过将人声负载在高频载波上,可以通过Siri使iPhone发起FaceTime通话。
【新智元导读】亚马逊的Alexa在CES上的大获成功让关于智能语音的话题再次被业界广泛谈起。低调的亚马逊似乎已经在这一潜力巨大的市场上完成了布局。大家的共识是, 智能语音助理将成为下一代计算平台,在国外,目前这一市场竞争已经呈白热化,虽然亚马逊 独占鳌头,但谷歌、微软和苹果也不是没有机会。可以看到,虽然市场争夺战异常激烈,但是语音要成为智能时代全新的操作系统,在语音识别、自然语言理解、用户界面设计乃至安全隐私方面都还存在急需解决的难题。本文带来智能语音市场、技术两方面的深入解析。 2017年的 CES上,亚
安妮 编译整理 量子位 出品 | 公众号 QbitAI 在国内语音助手竞争白热化时,Alexa与Cortana(小娜)竟然成了好朋友。 昨天,亚马逊CEO Jeff Bezos与微软CEO Satya
近日,有消息称,谷歌正在为其手机Pixel中的Google Assistant添加一个名为“Home Control”的新功能,将允许用户通过Google Assistant虚拟助理来控制智能家居设备。未来,除了谷歌旗下的智能家居设备,若用户购买其他非谷歌的智能家居设备,同样也可以享受到使用语音控制的便利。 目前的智能家居市场中,凭借着搭载语音助手Alexa及多项第三项服务的Echo和Dot,亚马逊成为了业界公认的行业老大。去年智能家居市场究竟如何,我们还尚未得知,不过,根据此前statista的调查数据显
导读:从市场披露的投资数据分析,在2011年到2015年的五年时间,人工智能领域的并购资金从2.82亿美元增长到2015年的23.88亿美元,而并购数量也从67起增长到397起。以谷歌、苹果、IBM、
在人工智能产业中,应用层是一个极大的部分,是人工智能技术最终的目的地。除了机器人、无人机和无人驾驶等硬件产品之外,人工智能的软件应用在单独商业化的同时,也在为这些硬件产品提供服务,像智能家居的语音控制
谷歌再出黑科技 用人工智能模拟出来的声音 几乎可以和真人以假乱真 在我们的印象中,机器的声音都是冰冷的电子音,虽然人类也一直致力于研究让机器“说人话”,但搞出来的成果似乎还是跟人类真实的声音差距很大,生硬、不自然一直是通病。 在这方面,谷歌倒是一直不遗余力的在研究,所谓只要功夫深,铁杵磨成针。前段时间,他们终于宣布,让机器说人话这事儿,有进展了!!! 谷歌最近发布了一个利用神经网络合成语音的模型,它可能会让电脑发出的声音变得更有“人味儿”。 根据dailymail报道,谷歌最近展示了一种新的语音系统
今天凌晨的Google I/O开发者大会不像以往的历届,貌似今年的人工智能和智能家居抢走了Android系统的风头。以往每年应该都是 Android 新系统的发布才是重点。看来人工智能和虚拟现实确实是未来的趋势和重点,再怎么抢风头,它们的发展也离不开我们的智能手机啊,所以作为 Android 开发者我们继续努力吧,今天我们就重点介绍跟我们Android开发相关的内容,下面是我的整理。 简单介绍 今天,Google一年一度的 I/O 开发者大会在加州山景城开幕。Google I/O是由Google举行的网络开
近段时间,包括谷歌、苹果、亚马逊、Facebook等在内的科技巨头纷纷被曝出人工收集用户语音数据。
每年5月,Google I/O大会都会引起一番热议,今年也不例外。本次大会于美国时间5月8日正式开幕,焦点仍是AI,其中大部分产品的新功能都是AI和机器学习的功劳。这次的关注点主要在软件上,如何充分利用这些软件,此外,谷歌还在大会前将Google Research更名为Google AI,对于接下来Google的发展方向,这一变化也给了我们诸多提示。
【新智元导读】本文介绍的是WaveNet——一个原始音频波形深度模型。我们展示了,Wavenet能够生成模仿人类的语音,听起来要比现有最好的文本到语音转化系统更自然,将与人类表现的差距缩减了50%以上。 在我们的展示中,相同的网络能被用于合成其他的音频信号,比如,音乐。在这里,我们提供了一些样本——自动生成的钢琴曲。 会说话的机器 让人能与机器对话是人机交互长期以来的一个梦想。近年来,随着深度神经网络的应用(比如,谷歌的语音搜索),计算机理解自然语音的能力取得了革命性的进展。但是,用计算机生成语音仍然大量地
曾在谷歌大脑实习的视觉搜索创业公司Clarifai CEO马修·塞勒称:“谷歌的一切都由机器学习驱动。”国外媒体近日撰文揭秘重塑谷歌帝国的人造大脑。文章指出,3年前创建的谷歌大脑项目表现越来越抢眼,其
机器之心报道 参与:机器之心编辑部 2018 年 5 月 8 日,一年一度的谷歌 I/O 开发者大会在美国加州山景城开幕。2016 年谷歌从移动优先到人工智能优先(AI-first),两年来我们从谷歌 I/O 看到了谷歌如何践行这一战略。在今日刚刚结束的 Keynote 中,机器学习依旧是整个大会的主旋律:谷歌发布了 TPU 3.0、Google Duplex,以及基于 AI 核心的新一代安卓操作系统 Android P,也介绍了自己在 News、Map、Lens 等众多产品中对 AI 与机器学习模型的应用
【新智元导读】科技圈内愈演愈烈的AI竞赛中,作为巨头之一的苹果似乎一直找不到存在感。Siri 推出已有五年,一直不瘟不火,最近更是受亚马逊 Alexa 以及谷歌Now、Home和Allo的强烈冲击。但是,从苹果自去年底开始的一系列动作,综合其在硬件推广方面的天然优势,加上越来越紧迫的市场竞争,很多观察家认为,在即将于后天凌晨举行的 2016 WWDC大会上,苹果可能会用新一代的 Siri 作出强力反击,并顺势走上AI竞赛的快车道。 丧钟为谁而鸣,Siri 被逐渐遗忘的五年 许多iPhone用户对Siri的印
亚马逊Alexa在其官方博客宣布推出Alexa Auto SDK,这是Alexa首次为车辆提供一整套开发套件,以帮助汽车制造商将Alexa语音控制功能集成到汽车及其娱乐信息系统。
在人工智能的辉煌进程中,语音识别技术无疑占据了一个至关重要的地位。从最初的简单命令识别到今日能理解复杂语境的智能助手,语音识别技术已经深入人类生活的各个角落。它不仅改变了我们与机器交流的方式,更开启了一个全新的互动时代。
近日,LG与亚马逊宣布就智能家居领域进行合作。具体细节方面,LG表示,他们将把亚马逊的服务(例如Alexa服务、“Dash”等)植入到自己的产品当中。与此同时,Alexa服务也会支持LG的SmartT
雷锋网按:本文摘选自长城证券报告——互联网迎来AI 时代,海外科技巨头争先布局:人工智能深度报告(国外篇一),在未改变原意的基础上略有删减。 PC互联网时代的企业核心竞争力为软件产品的快速反应能力,移动互联网时代是构建移动端的生态系统,人工智能时代则更为依赖 AI 核心技术。 AI技术拥有两大要素: 核心技术平台 数据循环 只有将 AI 技术与数据结合,才可形成实用性的业务。本文主要侧重于介绍IBM、Google在基础层、技术层、应用层全面布局AI,并对其扩展应用场景等内容进行介绍。 IBM——Watso
AiTechYun 编辑:xiaoshan.xiang 今天,IBM推出了沃森助手,这是一项针对公司的新服务,旨在为他们的产品构建语音激活的虚拟助理。想让酒店的房间记住客人对空调的偏好吗?或者通过语音
人工智能解决方案哪家强?还看Jibo、Pepper、Siri、Google Now和Cortana。目前,在他们之间正进行一场比赛,看谁提供的个人助理更受企业、最终用户和消费者的欢迎,不管是实体的还是
最近几年,语音技术的普及率激增。然而,伴随着这种增长的是制造语音控制设备的科技公司对语音数据的收集。因此,消费者和企业对语音隐私的担忧越来越大。
一年一度的谷歌I/O大会终于到来,这场科技盛会吸引了全球各地的开发者和用户,这次,整个大会都围绕着各种AI技术,可以说谷歌越来越离不开AI了。
领取专属 10元无门槛券
手把手带您无忧上云