前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >取代MNIST?德国时尚圈的科学家们推出基准数据集,全是衣裤鞋包

取代MNIST?德国时尚圈的科学家们推出基准数据集,全是衣裤鞋包

作者头像
量子位
发布于 2018-03-27 08:25:50
发布于 2018-03-27 08:25:50
9110
举报
文章被收录于专栏:量子位量子位
李林 编译整理 量子位 报道 | 公众号 QbitAI

MNIST,是一个手写数字数据集,除了用在机器学习入门的教学中,它还是对机器学习算法进行基准测试的常用数据集。

但是,总有人觉得MNIST不够好,想要扩充、改进、替代它。

今天,德国研究机构Zalando Research在GitHub上发布了一个名叫Fashion-MNIST的数据集,其中训练集包含60000个样例,测试集包含10000个样例,分为10类。样例都来自日常穿着的衣裤鞋包,每一个都是28×28的灰度图像。

除了内容不一样,这个数据集的图片尺寸、训练/测试集划分、文件的存储结构,都和MNIST一模一样。

这个数据集虽然名字里带有“fashion”,内容也都是服饰,但它的目标用途和时尚毫无关系:它致力于成为MNIST的替代品,用作机器学习算法的基准测试。

Fashion-MNIST(左)和原始MNIST(右)的t-SNE可视化展示

为什么要替代MNIST呢?

Zalando Research在这个数据集的说明中称,AI/机器学习/数据科学界的同学们搞出一个新算法之后,往往会先在MNIST上做基准测试,来验证这个算法。

于是,在这些群体之间流传着这样一种说法:如果一种算法连MNIST都搞不定,那它就是真没用;如果它能搞定MNIST,放到别的地方也不一定管用……

MNIST不好用,主要是因为它太简单了。甚至有人证明过,如果只是想区分开两个手写数字,很多时候识别一个像素就够了。

Google研究员、Keras作者François Chollet也曾经说,MNIST有很多问题,但其中最严重的一个,是它对于计算机视觉任务真的不具有代表性,做计算机视觉的算法,至少应该用CIFAR10这个复杂程度的数据集。

这次推出fashion-MNIST,想要取代MNIST的是德国研究机构Zalando Research,隶属于主营衣服鞋子的德国电商公司Zalando。

最后,如果你想试试这个fashion-MNIST数据集,请到https://github.com/zalandoresearch/fashion-mnist

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-08-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
keras中的数据集
数据在深度学习中的重要性怎么说都不为过,无论是训练模型,还是性能调优,都离不开大量的数据。有人曾经断言中美在人工智能领域的竞赛,中国将胜出,其依据就是中国拥有更多的数据。像Google、amazon、腾讯、阿里巴巴之类的巨头,其产品属性天然拥有大量的数据,那对于个人和小型创业公司,数据从哪儿来呢?
云水木石
2019/07/01
1.8K0
连LeCun都推荐的Fashion-MNIST数据集,是这位华人博士的成果
允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 上周六,量子位在报道中提到德国时尚圈的科学家,推出一个名叫Fashion-MNIST的数据集。这个数据集里都是衣裤鞋包,但它的目标是替代MN
量子位
2018/03/27
1.5K0
连LeCun都推荐的Fashion-MNIST数据集,是这位华人博士的成果
图像分类入门,轻松拿下90%准确率 | 教你用Keras搞定Fashion-MNIST
这篇教程会介绍如何用TensorFlow里的tf.keras函数,对Fashion-MNIST数据集进行图像分类。
量子位
2018/07/20
2K0
机器学习5年大跃进,可能是个错觉
回想2012年,Hinton带着学生们以ImageNet上16.4%的错误率震惊计算机视觉研究界,似乎已经是远古时期的历史。
量子位
2018/07/20
3360
【动手学深度学习笔记】之图像分类数据集(Fashion-MNIST)
这个数据集是我们在后面学习中将会用到的图形分类数据集。它的图像内容相较于手写数字识别数据集MINIST更为复杂一些,更加便于我们直观的观察算法之间的差异。
树枝990
2020/08/20
3.7K0
【动手学深度学习笔记】之图像分类数据集(Fashion-MNIST)
学界 | 当前机器学习成果真的可靠吗?伯克利MIT新研究质疑基准测试集
大数据文摘出品 编译:小鱼、蒋宝尚、魏子敏 近日,伯克利和MIT研究者发布的一篇名为《Do CIFAR-10 Classifiers Generalize to CIFAR-10?》的新论文提出了学界
大数据文摘
2018/06/29
3400
[Keras深度学习浅尝]实战一·DNN实现Fashion MNIST 数据集分类
Fashion-MNIST是一个替代MNIST手写数字集的图像数据集。 它是由Zalando(一家德国的时尚科技公司)旗下的研究部门提供。其涵盖了来自10种类别的共7万个不同商品的正面图片。Fashion-MNIST的大小、格式和训练集/测试集划分与原始的MNIST完全一致。60000/10000的训练测试数据划分,28x28的灰度图片。你可以直接用它来测试你的机器学习和深度学习算法性能,且不需要改动任何的代码。
小宋是呢
2019/06/27
1.2K0
[Keras深度学习浅尝]实战一·DNN实现Fashion MNIST 数据集分类
Fashion-MNIST 一周年 | Google NIPS最爱,还登上了Science
导语:本文回顾了Fashion-MNIST发布后的一年里在人工智能/机器学习学术圈和社区中所取得的进展。该数据集的初衷是替代MNIST,为机器学习提供一个新的基准集。一年里,Fashion-MNIST有超过250篇学术论文引用。来自Google, Cambridge, 北大, UCLA, Microsoft等250家研究机构横跨38个国家的研究员在实验中使用了这个数据集,他们的成果发表在NIPS、ICLR、ICML等顶会甚至Science等知名刊物上。 引言 距离我2017年8月发布Fashion
腾讯技术工程官方号
2018/10/12
6920
Fashion-MNIST 一周年 | Google NIPS最爱,还登上了Science
20用于深度学习训练和研究的数据集
数据集在计算机科学和数据科学中发挥着至关重要的作用。它们用于训练和评估机器学习模型,研究和开发新算法,改进数据质量,解决实际问题,推动科学研究,支持数据可视化,以及决策制定。数据集提供了丰富的信息,用于理解和应用数据,从而支持各种应用领域,包括医疗、金融、交通、社交媒体等。正确选择和处理数据集是确保数据驱动应用成功的关键因素,对于创新和解决复杂问题至关重要。因此,数据集不仅是技术发展的基础,也是推动科学进步和社会决策制定的强大工具。
deephub
2023/09/14
6300
20用于深度学习训练和研究的数据集
AI朋克致敬MNIST:只用Python和开发板,制作永不重样的时钟
我们见惯了上古时代,由电子管组成的时钟。在 AI 时代,有没有更加新潮的时间显示方式?是的,数据集也能做成时钟,每天早上,让 MNIST 手写数字唤醒你一天的记忆。
机器之心
2020/03/11
5540
为ML带来拓扑学基础,Nature子刊提出拓扑数据分析方法
从数学理论的角度来理解并提升机器学习方法,这也是近来非常有潜力的研究方向。不论是以前通过常微分方程或偏微分方程形式化神经网络,还是这一篇从拓扑学的角度强化神经网络的鲁棒性,也许当更多的数学基础被赋予机器学习时,它的发展与创新就会变得更加有「规律」。
机器之心
2019/09/03
7470
为ML带来拓扑学基础,Nature子刊提出拓扑数据分析方法
图像分类经典项目:基于开源数据集Fashion-MNIST的应用实践
图像分类是计算机视觉和数字图像处理的一个基本问题。传统的图像分类方法通过人工设计提取图像特征,而基于深度学习的图像分类方法能够自动提取特征,其中卷积神经网络(CNN)近年来取得了惊人的成绩。
Datawhale
2020/04/01
2.6K0
深度学习100问-12:深度学习有哪些经典数据集?
很多朋友在学习了神经网络和深度学习之后,早已迫不及待要开始动手实战了。第一个遇到的问题通常就是数据。作为个人学习和实验来说,很难获得像工业界那样较高质量的贴近实际应用的大量数据集,这时候一些公开数据集往往就成了大家通往AI路上的反复摩擦的对象。
石晓文
2020/03/24
7690
深度学习100问-12:深度学习有哪些经典数据集?
Pytorch 基于VGG-16的服饰识别(使用Fashion-MNIST数据集)
✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 🍎个人主页:小嗷犬的博客 🍊个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 🥭本文内容:Pytorch 基于VGG的服饰识别(使用Fashion-MNIST数据集) 更多内容请见👇 Python sklearn实现K-means鸢尾花聚类 Pytorch 基于LeNet的手写数字识别 Pytorch 基于AlexNet的服饰识别(使用Fashion-MNIST数据集) ---- 本文目录 介绍 1
小嗷犬
2022/11/15
1.3K1
Pytorch 基于VGG-16的服饰识别(使用Fashion-MNIST数据集)
Pytorch 基于ResNet-18的服饰识别(使用Fashion-MNIST数据集)
✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 🍎个人主页:小嗷犬的博客 🍊个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 🥭本文内容:Pytorch 基于ResNet-18的服饰识别(使用Fashion-MNIST数据集) 更多内容请见👇 Pytorch 基于AlexNet的服饰识别(使用Fashion-MNIST数据集) Pytorch 基于VGG-16的服饰识别(使用Fashion-MNIST数据集) Pytorch 基于NiN的服饰识别
小嗷犬
2022/11/15
1K0
Pytorch 基于ResNet-18的服饰识别(使用Fashion-MNIST数据集)
【数据集】机器学习数据集汇总(附下载地址)
(Stanford)69G大规模无人机(校园)图像数据集【Stanford】 http://cvgl.stanford.edu/projects/uav_data/
zenRRan
2020/02/18
5.7K0
Pytorch 基于AlexNet的服饰识别(使用Fashion-MNIST数据集)
✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 🍎个人主页:小嗷犬的博客 🍊个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 🥭本文内容:Pytorch 基于AlexNet的服饰识别(使用Fashion-MNIST数据集) 更多内容请见👇 Python sklearn实现SVM鸢尾花分类 Python sklearn实现K-means鸢尾花聚类 Pytorch 基于LeNet的手写数字识别 ---- 本文目录 介绍 1.导入相关库 2.定义 Al
小嗷犬
2022/11/15
8280
Pytorch 基于AlexNet的服饰识别(使用Fashion-MNIST数据集)
一周AI看点 | 谷歌标志性“萤火虫”无人车退役,Keras 2.0.7 强化TensorFlow开发能力
本期一周AI看点包括行业新闻、技术应用、技术前沿、大咖观点以及投融资等方面。 行业新闻 谷歌发布迷你版 Google Home,对标 Echo Dot 据外媒 Android Police 报道,谷歌有望在今年的硬件发布会上发布一款迷你版 Google Home,按照去年谷歌发布 Pixel 手机以及 Google Home 的时间节点,该硬件发布会很可能会在今年 10 月举办,但具体时间地点目前不能确定。据了解,该迷你智能音箱或将成为亚马逊 Echo Dot 的直接竞品,作为家庭智能产品的中控平台,通
AI科技大本营
2018/04/27
1.2K0
一周AI看点 | 谷歌标志性“萤火虫”无人车退役,Keras 2.0.7 强化TensorFlow开发能力
Pytorch 基于NiN的服饰识别(使用Fashion-MNIST数据集)
✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 🍎个人主页:小嗷犬的博客 🍊个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 🥭本文内容:Pytorch 基于NiN的服饰识别(使用Fashion-MNIST数据集) 更多内容请见👇 Pytorch 基于LeNet的手写数字识别 Pytorch 基于AlexNet的服饰识别(使用Fashion-MNIST数据集) Pytorch 基于VGG-16的服饰识别(使用Fashion-MNIST数据集) -
小嗷犬
2022/11/15
5210
Pytorch 基于NiN的服饰识别(使用Fashion-MNIST数据集)
【DataFountain-CV训练赛】
比赛链接:https://www.datafountain.cn/competitions/488/datasets
致Great
2021/01/06
1.2K0
推荐阅读
相关推荐
keras中的数据集
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档