自动驾驶汽车、机器人如何看到世界

文章来源：企鹅号 - 诺粞

自动驾驶汽车、机器人如何看到世界.自动驾驶汽车、机器人如何看到世界.

计算机视觉是机器的双眼，是实现自动驾驶汽车、机器人视觉的关键技术。人类有两只眼睛，所以我们能够自然地感知深度。但是，当计算机视觉应用程序依赖于一个摄像头来捕获和解释周围的世界的时候，丢失的第三维限制了计算机视觉的性能。所以需要摄像头阵列，也就是通常在不同位置设置的多个摄像头来拍摄多帧图像，并且根据多帧图像间的细微差别来估计深度。常见的是，两个摄像头的位置设置的稍有距离，以模仿人的双眼。拍摄空间中每一个点，分别从两个摄像头拍摄，能的大两个图像，而这两帧图像会都略有区别，根据几何学，这个区别，我们可以计算该点的深度。

2. 机器人：用于导航、定位、映射和避免碰撞

3. 自动驾驶

4.面部识别：防止欺诈

5. 手势检测：用于游戏等

谈到如何区分图像的内容，就要提到语义分割。语义分割意味着将图片分成多个有意义的部分。就像你透过窗户看到的那样，你将整个画面划分为天空、汽车、高楼以及视野中的任何东西。

在计算机眼中是这样一张街景图，通过简单的语义分割，给出路面、天空等的大概位置，我们就可以生成一张最终图像。大家可以看到完整的车、路、房子的高质量生成结果。这也是图像分析的关键：如果分割不良，后续任务的性能也会降低。由于我们有两只眼睛并且可以利用三维的视图，分割是很自然的。传统的计算机视觉只有一个摄像头，因此分割主要基于统计建模。目前，通过典型的关键线索，例如颜色、边缘、纹理等的变化，也就是在提取特征，所以计算机视觉的相关研究方向也可以由此展开。计算机如何描述图像？通过特征来描述。

其他方面，相机阵列部署方便，成本也很低，其开发工作主要在软件方面。双摄像头解决方案已经广泛用于许多智能设备和智能手机中。我们需要更好的算法来扩展其深度传感性能。改进硬件也无济于事。这个问题更像是一个数学问题，而不是一个工程问题。（完）

发表于: 2018-11-142018-11-14 22:28:30
原文链接：https://kuaibao.qq.com/s/20181114A1Z6SH00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

自动驾驶汽车、机器人如何看到世界

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐