人工智能,这个词儿对我们来说既熟悉又陌生,说熟悉是现在的话语环境当中人工智能始终是个热门话题;而说陌生又是因为人工智能似乎只存在于话题中,真正能够让我们用到的少之又少,离我们最近的人工智能可能就是那些智能推荐算法了吧,但你真的觉得这是好事吗?
于是今天的百度AI开发者大会,笔者就特别盯着这方面,能够让人工智能脱离高谈,而实际造福用户的产品和服务到底会不会有。值得高兴的是,确实我看到了能够摸得着的东西。
01自动泊车系统今年就落地
首先就是百度的自动泊车系统居然进度会这么快,今年就能量产落地,实实在在地让人们用上,这是我没想到的。
具体来说,百度自主泊车解决方案是解决司机在停车和取车过程中的效率利用问题的,它能够自动帮助车主停车和取车。
先来说停车,自主泊车解决方案能够在车主达到目的地下车后,自动将车停入停车场。
与一般的自动停车不同,这套系统甚至不用车主自己将车开到停车场,车辆能够智能跟行在车流中,自己开进停车场,然后把自己停好。
再来说取车,车主不用亲自跑一趟车库去开车,而是通过远程控制将车召唤到身边来,这个过程中也是全自动的方案。如果你看过蝙蝠侠,那么蝙蝠车就是这么做的。
这上面的东西听起来很玄乎吧?但它离我们真的不远,不用十年以后五年以后,就是今年。
百度表示自主泊车解决方案已拿到多个车企的订单,在今年就能实现量产,落地服务。如果你有兴趣,今年就能摸到用上。
02中英语音混合输入的问题终于解决了
接下来说说人工智能自然语言方面的新进展,这次的进步也是肉眼可见的,而且解决了一个特别现实的问题——中英语言混合输入。
不知道大家在使用语音输入法时有没有遇到过这个问题,即在我们说的一句话中同时包含中文和英文,输入法就无法区分而直接将英文根据语音相近识别成中文。这个在我们人类看来很容易就能区分出的东西,在人工智能上就是一个大难题,很大程度上影响了语音输入的易用性。
但百度现在解决了这个问题,百度语音技术部的成果在今天的会场上进行了展示,就是实现百度输入法语音的中英混输。
从演示的效果来看,一句中文混杂的句子中的英文和中文都被准确地识别了出来,而且过程还很流畅。
作为普通的用户,我们不必知道这是得益于百度大脑5.0的升级,也不用弄清百度大脑的截断注意力模型,只需要知道中英混输现在可以实现了,准确率也得到了很大提升就可以了。
其实这才是科技至于普罗大众的真正意义,人们并不关心这背后的技术是怎样实现的,你只要告诉大家这个可以用了,而且很好用。
03更像活人的语音助手今天就上线
当然今天开的是开发者大会,主要是面向开发者的,因此技术问题不能回避,而笔者要做的就是把这些技术问题转化成大家能理解,并且真正关系到我们生活的内容。
比如下面要说的这个百度小度“全双工免唤醒能力”,这个词听上去很咋呼,其实很容易理解,而且这也是个马上就能用起来的新技术。
简单来说,我们现在用的绝大部分智能语音助手都需要在通过特殊的指令先将其唤醒,然后才能提供服务,比如“嘿Siri”之类。而且这些智能助手每一次唤醒就只能执行一项任务,比如我们查看地图需要喊一次“嘿Siri”,要订餐就需要再喊一次“嘿,Siri”。
这显然是一个很僵化的开关式的互动,而“全双工”就是让这个人机互动的过程不再这么楞。那么百度小度的这个“全双工免唤醒能力”能做到什么程度呢?
首先就是“一次唤醒,多轮交互”,在唤醒之后不再只能执行一项任务,而是可以持续地进行互动,这就是一个很大的进步了。
接下来的这个就更“黑科技”了,“全双工免唤醒能力”最大特点在于你不用去刻意唤醒智能助手,而是智能助手能够语境分析进行判断,是应该加入对话执行任务,还是应该只听着不搭话。
比如你在和家人聊天时突然让小度执行某个任务,它就可以快速响应进行执行,而在之后你与家人的继续对话中,它不会乱插话或是将你的话识别为对它的指令。整个交互过程更像是一个人,而不是工具。
听上去是不是很神?要不要等很久?不用。“双全工免唤醒能力”现在已经在小度在家系列产品上线,只要升级到最新软件版本就可以实现。
04让人工智能触手可及意义更大
当然今天的百度AI大会上还有很多硬的内容,比如和华为麒麟合作,推出新的远场语音交互芯片鸿鹄等等,但这些离我们普通消费太远。
笔者今天感受最深的就是,抛掉那些星辰大海的宏远目标,也已经有这些我们普通百姓马上就能享受到的眼前的实惠。让一些比较浅层基础的人工智能应用先落地,给大众用上,这是相当明智的策略。
笔者相信这些年不少人听人工智能都听得耳朵起茧子了,甚至有些反感这样没有实物的鼓吹了,有这样一批能够亲自上手用于日常工作生活中的产品和服务,其实意义重大。
最后,笔者也鼓励大家去试一试这样的产品及服务,亲身感受一下实际带来的变化,再对人工智能进行一番新的评判。
(本文图片来自网络)
(7208488)
领取专属 10元无门槛券
私享最新 技术干货