全文3300+字,阅读预计耗时9分钟
如果要让笔者评价哪一家公司是全球AI技术最强的公司,那么笔者会毫不犹豫地回答:Google!
从AlphaGo开始,Google的AI技术就吸引了全世界的目光,即使是微软、Facebook这样的互联网巨头其AI技术都不一定有Google那么强悍,即使他们做到了,他们也并没有像Google去做一个公开展示甚至是实装到每一个用户都能看得见、摸得着的地方。
Google的AI技术给笔者的感觉就是充满了科幻感,他们把很多我们曾经幻想的AI应用场景非常真实地做了出来,Google在AI方面的每一个进步都能让我们感到几分惊艳,例如进化过的Google翻译、进化过的Google Assistant等等。
这一次Google I/O大会上Google是直接用强悍的AI技术撑满了全场,让笔者感觉Google可能已经押宝AI,整个公司的战略已经从“Mobile First”调整为了“AI First”。Google希望未来自己可以利用在AI技术上的领先吊打其他互联网巨头,颇有一种“我有AI我就是天下第一牛B”的感觉。
废话不多说,我们一起来看看Google都给我们带来了什么样的新东西。
Google Assistant
Google Assistant这一次是得到了全面的进化,首先是其发音。
Google旗下的DeepMind曾经开发过一个特别强大的基于人工智能的语音生成算法 —— Wavenet,该算法生成的语音在听感上与母语是英语的人说话没有什么区别,甚至可能要更好。
这一次Google直接把Wavenet应用到了Google Assistant上,现在的Google Assistant拥有6种发音非常自然的新声音,不过这些语音都只是英语语音,其他语言可能还有待进一步跟进。
值得一提的是Google CEO Pichai希望用户和Google Assistant的交互可以更为自然,在多轮对话迭代之后,用户甚至可以不需要“Hey Google”这个指令来启动它,它可以自我响应用户的指令,这是相当高级的。
不过仅仅只有这些的话,对于Google Assistant来说只是一个小升级而已。真正的进化在于,Google在Google Assistant中整合了一个名为“Google Duplex”的新技术。
在日常生活中,我们有时候需要打电话给美发店预约时间,或者打电话给饭店预约座位,或者打电话给快餐店预定外卖。这样的操作往往是很繁琐的,一方面电话的交流比较低效、耗时,另一方面有一些人会心理上不太愿意去打电话,在国内,互联网巨头给出的解决方案是美团、大众点评这样的产品,而在国外,由于老外们没有这样完全基于线上的解决方案,所以他们日常还是要面对繁琐地打电话到各种店铺预约这样或是那样的服务。
为了解决这一痛点问题,Google Assistant将利用Google Duplex技术在后台自动为你打电话去完成各种服务的预约。这意味着Google Assistant将实现和微软小冰类似的全双工语音,同时由于要和陌生的真人进行实际交互,Google Duplex需要让语音足够自然,足够易懂。
以下是笔者从TechInsider搬运过来的一个完整的现场演示,这一演示可以说是把全场的气氛带到了一个高潮:
要注意的是这并不意味着Google Duplex可以通过图灵测试,因为它是针对电话预约服务这样的场景进行过特殊优化的,而且即使在这个场景下Google Duplex仍然会有智商不够的表现。
不过不管怎么说,能做到现在这个程度,已经非常非常惊艳了,最重要的是这个技术将不只是停留在PPT上,这项技术会实装到每个用户的Google Assistant上。将技术落实到实际,这才是最重要的。
Google Photos
实际上AI在图像领域的应用已经是相当广泛的了,对于我们这些普通用户来说,我们现在已经可以通过相机实时识别物体、文字,在拍照过程中可以对场景进行实时计算进行优化。
Google Photos这一次提供了一个很强悍的功能,简直是AI界的美图秀秀。
Google Photos将可以对图片进行智能的处理,例如修复过曝的图片、动态调整图片的色彩等等。其中最为强大的一点是,Google Photos支持给黑白照片填色,虽然这个应用在两三年前就已经出现了,但是这一次是这项技术第一次如此大规模的应用。
Google Lens
Google Lens也做了一些功能上的更新,不过这些功能更新没有什么太大的亮点, 很多是国内厂商已经做过玩剩下的,例如OCR、物体识别、搜同款等等,这些功能在今天已经算不上亮点。
笔者觉得Google Lens比较有吸引力的一个功能是Google加入了一个针对文档的特别功能,在拍照的时候Google将允许用户直接提取照片中的文档并转化成PDF,从演示来看这个效果是要比扫描全能王更好、更快的,未来着可能会成为笔者提升工作效率的一大工具。
其次Google Lens的OCR虽然不是亮点,但是它在交互方式上比较新颖,用户可以直接复制图片上的文字,甚至可以进行快速搜索,这个交互模式能更好地提升效率。
Google News
在国外Google News可以说是相当多人必备的资讯类App,这一次Google甚至是给Google News加入了AI元素。
这是一个实时的基于人工智能的信息筛选,它和国内应用厂商做的个性化资讯推送略有不同,它可以将相关的资讯归类到一起,并且可以“提前”为你做好资讯的分类。
对于信息来源Google也会运用AI进行审查,用来过滤一些虚假的信息,尽全力使你看到的资讯是最真实的。
Gmail
Gmail这个功能就相当不一般了,可以说Google以一种相当丧心病狂的方式暴力地提升了用户编辑邮件的效率。
通过Smart Compose技术,Google会自动根据你输入的上下文、你所回复的邮件自动猜想出整个句子,代替你完成繁琐地输入。这个功能可以让让你回复邮件的效率直线提升。
不过很遗憾这个技术目前也应该只支持英文,笔者希望国内例如腾讯这样的大厂可以跟进一下这样的技术,这确实相当实用。
TPU
最后,强大的AI技术是需要强大的硬件作支撑的,Google今年也是又一次更新了TPU,TPU的计算能力又一次得到了暴增。
对于很多AI芯片厂商来说,AI芯片的发热量一直是一个让人相当头疼的问题,这种暴力的AI芯片和CPU一样,高算力意味着高功耗,也意味着高发热。
Google是直接给新一代TPU上了液冷,可见新一代TPU的暴力程度。这个液冷方式和我们平时在PC DIY领域看到的水冷有那么一些不同,一块TPU基板上有4个计算芯片,为了让这些芯片都能保持“冷静”,Google采用了这样一种看上去很奇怪的散热设计。
根据Google的描述TPU的算力已经可以媲美NVIDIA的GPU了,在AI芯片这一块Google可能会和NVIDIA形成一个比较激烈的竞争,因为一旦Google公开出货TPU或者大规模通过云平台开放TPU,那么NVIDIA的显卡也好、AI专用的计算卡也好都会面临卖不出去的尴尬处境。
整场I/O大会除了Android P以外基本上都是AI,关于Android P我们明天再说,Android P的亮点三言两语说不完。Google在AI领域可以说是走得相当顺风顺水,Google自己有硬件、有技术实力、有人才储备,笔者预计在未来三年Google的AI将进化到一个比较恐怖的程度。
不过凭借目前芯片的计算力,笔者认为至少五年内AI还发展不到科幻电影那种境界,目前世界上还没有任何一个AI是真正的“多面手”,你会发现所有的AI软件都是有针对性的、功能单一或类别单一的。对于所有的AI从业人员来说,如何将现有的这些各个方面的技术做一个融合向真正的人工智能进化才是核心问题,因为在三到五年后,AI的技术已经有比较深厚的技术积累了,基础技术与服务框架也构建得差不多了。
在笔者看来全球未来能和Google在AI领域抗衡的估计只有中国的互联网巨头们了,但是在一切开始之前,我们需要足够强悍的AI计算芯片,毕竟武器再强,扛不动,那也就只是一堆废铜烂铁而已。
今天的文章就到这里,如果你喜欢本文可以扫描下方的二维码关注我们,感谢你的支持。
这里是技宅空格,我们明天见。
领取专属 10元无门槛券
私享最新 技术干货