首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

识别真实生活环境中的物体:我们在哪里?

每天一分钟,带你读遍机器人顶级会议文章

标题:Recognizing Objects In-the-wild: Where do we stand?

作者:Mohammad Reza Loghmani, Barbara Caputo and Markus Vincze

来源:2018 IEEE International Conference on Robotics and Automation (ICRA), May 21-25, 2018, Brisbane, Australia

编译:杨雨生

审核:颜青松,陈世浪

欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权

摘要

对于机器人系统来说,在充满人群的环境当中识别出场景中的各个对象,是其应当具有的基本功能。尽管相关机器人和机器视觉研究团体进行了数十年的研究,机器人还是没有很好的视觉感知系统,这阻碍了机器人在实际生活中的进一步应用。这一过程之所以进展比较缓慢,其中一个原因是因为缺少一个实验平台,能够准确的描述机器人所感知到的世界。为了填补这一空缺,作者利用安装在移动机器人上的RGBD相机,采集了一个包含各种物体的数据集。本数据集在采集时考虑到了机器人在实际应用中面临的各种挑战,并且提供了一些有用的工具可以用来验证目标识别算法。本文除了介绍数据集的各种特点,还对一些代表性的卷积神经网络在新数据集上的表型进行了评估,同时分析了基于网页图片的深度表示向基于机器人采集的图片的深度表示的可迁移性。尽管描述的比较美好,但是实验表明,实际生活中基于机器人采集数据的物体识别,仍有很长的路要走。作者将数据集进行了公开,可以在下列网址进行下载。

https://www.acin.tuwien.ac.at/en/vision-for-robotics/software-tools/autonomous-robot-indoor-dataset/

图1 上图是作者数据采集的画面,画面左侧是移动机器人平台,采集的对象是日常生活中的物体。

图2 上图中是作者的数据集与其他RGBD数据集进行的比较,作者从光照条件,尺度,视角,背景,是否由机器人直接采集得到等方面,对不同数据集进行了比较。

图3 上图是数据集中的一些物体,其中每一个物体都属于一个不同的类别。

图4 上图中是数据集中的一帧画面,画面中的物体用bounding box进行了标注。

Abstract

The ability to recognize objects is an essential skill for a robotic system acting in human-populated environments. Despite decades of effort from the robotic and vision research communities, robots are still missing good visual perceptual systems, preventing the use of autonomous agents for real-world applications. The progress is slowed down by the lack of a testbed able to accurately represent the world perceived by the robot in-the-wild. In order to fill this gap, we introduce a large-scale, multi-view object dataset collected with an RGBD camera mounted on a mobile robot. The dataset embeds the challenges faced by a robot in a real-life application and provides a useful tool for validating object recognition algorithms. Besides describing the characteristics of the dataset, the paper evaluates the performance of a collection of well-established deep convolutional networks on the new dataset and analyzes the transferability of deep representations from Web images to robotic data. Despite the promising results obtained with such representations, the experiments demonstrate that object classification with real-life robotic data is far from being solved. Finally, we provide a comparative study to analyze and highlight the open challenges in robot vision, explaining the discrepancies in the performance.

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190816A037D200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券