欢迎点击「算法与编程之美」关注我们!
本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章。
mnist数据集可以从https://s3.amazonaws.com/img-datasets/mnist.npz这个网址进行下载,下载的文件是一种称为npz格式的文件,这是numpy库生成的特有的压缩包格式。
numpy可以将numpy.array格式的数组以文件的形式进行序列化存储到文件,然后以反序列化的方式读取文件并直接还原成之前的数组。
存储的文件主要有两种形式:*.npy和*.npz。
npy的基本用法
npz的基本用法
当需要将多个数组保存在一个文件的时候,则需要用到npz文件格式存储。
了解npy和npz的基本用法之后,接下来将介绍keras中mnist的数据集加载过程。
注:keras中下载的数据集默认的存放位置是:~/.keras/datasets/ 目录下。
可以看到mnist数据集的处理流程是将28x28x1的图片文件处理成四个numpy数组:x_train, y_train, x_test, y_test。然后将这四个数组写入到文件生成mnist.npz文件。
在使用数据集的时候,利用keras的get_file()先从指定的URL地址下载npz文件,然后加载得到两个tuple,下面是keras官方提供的mnist数据集load_data()方法:
END
主 编 | 张祯悦
责 编 | chen
领取专属 10元无门槛券
私享最新 技术干货