腾讯Tencent ML-Images项目的论文2019年1月8日在康奈尔大学的论文库中公布。
题目:Tencent ML-Images: A Large-Scale Multi-Label Image Database for Visual Representation Learning
作者:Baoyuan Wu, Weidong Chen, Yanbo Fan, Yong Zhang, Jinlong Hou, Junzhou Huang, Wei Liu, Tong Zhang
这项工作在新建的多标签图像数据库(称为 Tencent ML-Images)上展示了大规模的视觉表示学习。包含了 1800 万图像和 1.1 万多种常见物体类别,在业内已公开的多标签图像数据集中规模最大,足以满足一般科研机构及中小企业的使用场景。
该模型具有优异的视觉表示能力和泛化性能,在当前业内同类模型中精度最高,将为包括图像、视频等在内的视觉任务提供强大支撑,并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升。
论文下载地址:
https://arxiv.org/abs/1901.01703
github地址:
https://github.com/Tencent/tencent-ml-images
The main statistics of ML-Images are summarized in ML-Images.
Note:Trainable classindicates the class that has over 100 train images.
The number of images per class and the histogram of the number of annotations in training set are shown in the following figures.
(完)
更多人关注的公众号:
机器学习算法与Python精研
领取专属 10元无门槛券
私享最新 技术干货