首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能的下一个“杀手级”应用是什么?独家视频

摘要

人类对世界的认识及感知,有80%的信息来自于视觉,因此对视觉信息的搜集与处理,将成为人工智能下一阶段最重要的技术引擎。美国斯坦福大学计算机科学系终身教授、人工智能实验室主任李飞飞在第一财经《中国经济论坛》中分享了计算机视觉技术的最新进展及应用前景。

以下为《中国经济论坛》独家视频及嘉宾演讲实录精选:

李飞飞

美国斯坦福大学计算机科学系终身教授人工智能实验室主任

计算机视觉是人工智能领域重要的研究方向 将为数字世界带来光明

和人的视觉相比,机器的视觉只进化了大概不到60年的时间,计算机视觉在未来的发展里边,我希望它会对人类的各方面的产业和生活带来重要的影响。计算机视觉是人工智能这个大领域里边一个重要的研究方向。在我看来,它的功能、它的所有的作用就是给计算机世界带来光明。

计算机或者是人工智能它和人的关系应该是同理的、共赢的,尤其是在医疗这个场景,我希望它是一个守护天使,那今天我想说一个工作流场景,它就是关于这个医院内的住院感染。住院感染是一个非常严重的问题,在一个最近的新英格兰的报告里边,在美国有4%的住院病人会感染。这个有时候会造成病人的病情的恶化,甚至死亡。那为什么会出现这个感染问题呢?很大的一个原因是医生和护士没有很好的洗手,手部卫生是医院内感染的第一大原因。这个会造成大概350亿到400亿美元的损失,传统的办法基本上就是医院会请一些便装的监视人员,偶尔去做一些调查,然后看一下这些医生和护士有没有在一定的时间、一定的地点内做好手部卫生的事情。

计算机视觉技术做护士手部卫生监测准确度高 成本低 并能保护隐私

因为现代传感器的崛起,我们可以根据计算机视觉这个技术来做手部卫生的监测。它是持续的,它是非进入性的,它客观,非常的便宜,而且是人工智能。最最重要的是它还可以保护隐私。

我们这个是和斯坦福儿童医院合作的一个项目,在一个儿童医院的三楼的住院部,我们装了20多个深度传感器。然后通过这个来监控整个医疗人员的行为。这是两个不同的传感器,你可以看到这个人的进出,如果是红色的我们就说他没有洗手,绿色的就是他有做洗手这个动作。这个背后是需要一个计算机视觉的模型来观测和计算这个人的动作的。它分成两步,第一步是对人类的跟踪,每一个人他的流程和工作要通过这个传感器跟踪。第二步是当他走到快进这个病人的门的时候,他有没有做洗手这个动作,这一步叫动作检测,这是一个通过深度学习的模型来做的一个判断。

这是我们的结果,你可以看到对录像里边的每一帧,我们可以判断出这个人的手在哪里,他的动作是什么。和以前的其他的这个模型比,我们得到的效果是非常好的,它基本上完全在无人监视的情况下,它基本上可以达到被训练了的医生可以看到的准确度。机器在没有任何人的参与的情况下,做的比其他的便装人员的效果更好一些。

计算机视觉技术对智能医院的行为监控和行为优化将产生深远影响

所以在现在这个儿童医院的单元里边,我们不光是可以观测手部卫生,我们还可以观测所有的医生和护士的整个一天的行为和他们走到哪里等等。其实这是一个非常丰富的数据,它可以全天24小时不停地保持跟踪人类的行为。所以下一步在整个智能医院的这个监控和行为优化的过程中,这样的技术可以产生很深远的影响,而手部清洁仅仅是第一步。

人口普查是所有的政府非常非常重视的一个事情,所以我们和学生就在思考这个问题,就是有没有其他的方式得到我们这个全社会的行为或者是信息,而不用花费数十亿美元,因为这个实在是非常贵,而且它只能很多年做一次。那我们就想到了地图这个东西。

行驶中的汽车蕴含丰富的信息 与家庭和个人行为息息相关

谷歌地图里边有这么一个信息是叫街景视图,它不光是有道路的信息,它有照片,有整个城市、整个社区的照片。一幅图是非常非常丰富的,图里边有很多很多的信息。那么我们抓住了一个物体,至少在美国这个社会,有一个物体它给了大家非常多的信息,这个物体就是车。当你能识别一辆车的时候,你可以知道这辆车是什么,它是哪个厂家制造的,它多少钱,然后它的排气量是多少等等。所以车是一个信息很丰富的载体,尤其在美国这样的社会,基本上每一个家庭都有一到几辆车,所以它又跟每一个家庭和一个人的行为都息息相关。

利用物体识别技术识别谷歌街景视图中的汽车并进行建模分析

所以我们就提出了这么一个很好玩儿的项目,就是说我们能不能用车来分析整个美国社会。那我们做了一件什么事呢?我们选了美国人口最多的200个城市,然后我们在谷歌地图上下载了5000万幅谷歌街景,就是这些有车的图。这个城市大概是每十米我们就取样了一幅图,所以是非常密集的覆盖率。

首先我们需要用物体识别的方式把这些车给抠出来, 1990年以后全球范围内生产了大概3000种不同的车,我们把整个3000种车全部给建立了深度学习的模型,然后把它识别出来了。

所以我们发现一个很好玩儿的,就是我们通过这个人工智能的模型发现,下面这几个车的特征能表明比较有钱的家庭。比如说日产车,比如说日产的凌志车,还有德国车,都是可以表明比较高的家庭收入。而美国车、旧车,还有三个牌子:别克、奥兹莫比尔和道奇,表明比较低的家庭收入。

2008年美国总统大选通过车辆分析的选票数据与实际统计数据相似度非常高

最后再来一个好玩儿的问题,我们根据车的分析能不能表明投票率,或者是投票的这个结果。我们用了2008年的总统选举的奥巴马的投票数据。蓝色是选民主党,红色是选共和党,左边是实际的数据,右边是通过我们车的信息预测,它是非常的相似。

而且我们发现奥巴马得到的投票的这个州,它开车的人比较喜欢开轿车,然后这个车的排气量比较好,比较环保。而投共和党的比较喜欢开卡车,比较喜欢开SUV,所以这是比较好玩儿的一些信息。

通过对汽车的分析可以分析美国种族隔离情况以及犯罪率 面包车越多犯罪率越高

我们可以通过车来分析出比如说芝加哥是美国最种族隔离的一个城市,它的黑人区,或者是西裔,或者是白人区,它分得非常开。而杰克森维尔是一个种族隔离最小的的城市。我们也可以通过车分析出犯罪率,而且最好玩儿的是如果是一个城市它的面包车特别多的话,犯罪率就特别高。我们还专门去请教了社会学家,原来面包车是一个非常好的毒品交易的场所。所以面包车的数量预测犯罪率。

人工智能,尤其是计算机视觉还有很长很长的路要走,这是刚刚开始。所以我自己觉得通过这么60年来的积累,就像五亿四千万年前我们的物种有了一次寒武纪大爆发,那科技人工智能带来的先进科技也会产生一次,在不久的将来甚至现在大家会看到一次巨大的爆发和创新。谢谢大家!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180408B0104P00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券