如何使用导入的MNIST数据集？

MNIST数据集是一个广泛使用的手写数字识别数据集，包含了60000个训练样本和10000个测试样本，每个样本是一个28x28像素的灰度图像，代表一个手写数字（0到9）。以下是如何导入和使用MNIST数据集的基本步骤：

1. 导入MNIST数据集

使用Python和TensorFlow/Keras

import tensorflow as tf
from tensorflow.keras.datasets import mnist

# 加载数据集
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 查看数据集的基本信息
print("训练样本数量:", len(x_train))
print("测试样本数量:", len(x_test))

使用Python和PyTorch

import torch
from torchvision import datasets, transforms

# 定义数据预处理
transform = transforms.Compose([transforms.ToTensor()])

# 加载数据集
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform)

# 创建数据加载器
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=64, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=64, shuffle=False)

2. 数据预处理

归一化

为了提高模型的训练效果，通常需要对图像数据进行归一化处理。

# TensorFlow/Keras
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0

# PyTorch
# transform中已经包含了ToTensor()，它会自动将像素值归一化到[0, 1]

调整数据维度

确保数据维度符合模型的输入要求。

# TensorFlow/Keras
x_train = x_train.reshape((x_train.shape[0], 28, 28, 1))
x_test = x_test.reshape((x_test.shape[0], 28, 28, 1))

# PyTorch
# transform中已经包含了ToTensor()，它会自动调整维度

3. 构建模型

使用TensorFlow/Keras

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten, Conv2D, MaxPooling2D

model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    Flatten(),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

使用PyTorch

import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3)
        self.fc1 = nn.Linear(64 * 5 * 5, 64)
        self.fc2 = nn.Linear(64, 10)

    def forward(self, x):
        x = F.relu(self.conv1(x))
        x = F.max_pool2d(x, 2)
        x = F.relu(self.conv2(x))
        x = F.max_pool2d(x, 2)
        x = x.view(-1, 64 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return F.log_softmax(x, dim=1)

model = Net()

4. 训练模型

TensorFlow/Keras

model.fit(x_train, y_train, epochs=5, batch_size=64, validation_split=0.1)

PyTorch

import torch.optim as optim

criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

for epoch in range(5):
    for data, target in train_loader:
        optimizer.zero_grad()
        output = model(data)
        loss = criterion(output, target)
        loss.backward()
        optimizer.step()

5. 评估模型

TensorFlow/Keras

test_loss, test_acc = model.evaluate(x_test, y_test)
print(f'Test accuracy: {test_acc}')

PyTorch

model.eval()
correct = 0
total = 0
with torch.no_grad():
    for data, target in test_loader:
        outputs = model(data)
        _, predicted = torch.max(outputs.data, 1)
        total += target.size(0)
        correct += (predicted == target).sum().item()

print(f'Test accuracy: {100 * correct / total}%')

应用场景

MNIST数据集常用于以下几个方面：

教学和入门：适合初学者学习和实践深度学习基础概念。
模型基准测试：用于评估新算法或模型的性能。
研究：在计算机视觉和机器学习研究中作为标准数据集。

可能遇到的问题及解决方法

内存不足：如果数据集太大，可能会导致内存不足。可以通过分批次加载数据来解决。
数据不平衡：某些数字的样本数量可能比其他数字少，可以通过数据增强或重新采样来解决。
模型过拟合：可以通过增加正则化、使用Dropout层或增加训练数据来解决。

通过以上步骤，你可以成功导入和使用MNIST数据集进行手写数字识别任务。

页面内容是否对你有帮助？

有帮助

没帮助

进口dataset.mnist

、、

我正在跟踪一个，它正在使用MNIST作为它的手写图像。它有代码from dataset.mnist import load_dataset，当我尝试它时，它没有工作，给出了一个错误，说没有这样的模块名为dataset.mnist。我已经分别使用dataset和mnist下载了pip模块。这本书推荐使用Anaconda，但我尝试过，但没有成功。如何使用模块dataset.mnist

浏览 1提问于2019-07-07得票数 0

回答已采纳

2回答

如何将时尚MNIST转换为Dataset类？

、

我正在学习Tensorflow，并希望使用next_batch作为时尚-MNIST数据集。但我遇到了一个问题，因为Fashion-MNIST的数据集的格式与MNIST数据的格式不同。对于常规的MNIST，我们可以使用以下代码导入数据： from

浏览 0提问于2019-03-04得票数 0

1回答

如何使用导入的MNIST数据集？

、、、、

我不熟悉使用python作为ML工具，我想训练MNIST数据集。我已经使用"pip install python- MNIST“下载了mnist库，但不知道下一步应该做什么。导入语句应该是什么样子的？我是否也应该导入TensorFlow和/或Keras来训练数据？我知道MNIST数据集在TensorFlow和Keras中可用

浏览 35提问于2019-06-25得票数 1

1回答

Tensorflow不能加载mnist

、

我从一个随机网站下载了一份mnist数据副本，因为官方网站被关闭了。我可以把tensorflow的input_data方法的mnist文件放到哪个目录中去取它？

浏览 0提问于2018-11-07得票数 0

回答已采纳

1回答

我想用MNIST数据库训练一个模型。我正在开发Tensorflow tutorial 。建议导入数据库的方法是使用mnist = input_data.read_data_sets(FLAGS.data_dir, one_hot=True)，但我需要使用以下内容： with open('my这就带来了如何调整代码以与train_images, train_lables, test_images, test_lables一起工

浏览 2提问于2018-05-07得票数 4

1回答

在tensorflow中使用我自己的数据实现神经网络

、、、、

我有一个数据集，与MNIST数据集(28 * 28图像)非常相似。我已经关注了很多关于如何使用tensorflow实现基本神经网络的在线教程，并发现大多数都只是使用： from tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets("/tmp/data

浏览 0提问于2017-11-30得票数 0

1回答

从节点中的Keras JS加载MNIST数据集

、、、、

如何在Node中从KerasJS加载MNIST数据集？我导入了他们的头文件var mnist = KerasJS.mnist它会给出错误 TypeErro

浏览 18提问于2017-07-02得票数 1

2回答

如何为mnist数据集中的交叉验证准备数据？

、、、

如何对MNIST数据集使用k折叠交叉验证？我阅读了关于sci学习的文章文档，在那个例子中，他们使用整个虹膜数据集进行交叉验证。cross_val_score(clf, iris.data, iris.target, cv=5)例如，在keras中导入mnist数据集<

浏览 0提问于2018-03-19得票数 2

1回答

替换Tensorflow CNN模型中的MNIST数据

、

我正试图在tensorflow中自己的数据集上训练CNN模型。我使用下面的代码将我的数据转换为相同的MNIST格式。现在我不知道如何用我自己的数据替换MNIST数据。有没有办法用我自己的数据替换mnist数据，或者在tensorflow中导入它们？

浏览 0提问于2017-07-22得票数 0

1回答

如何从现有的TensorFlow数据集中删除某些类(标签和图像)？(时尚界MNIST)

、、

我刚刚开始学习更多关于TensorFlow和numpy的知识。我目前使用的时尚MNIST数据集与TensorFlow，其中包括10种类型的服装。但是，我希望能够编辑包含这些数据集的numpy数组，以删除所有不是“T恤”、“衬衫”和“裤子”的图像和标签。本质上，我只想创建一个只有这3种类型的时装MNIST数据集。(train_im

浏览 4提问于2020-07-15得票数 2

回答已采纳

1回答

如何保存jupyter笔记本内核的状态？

、、、

我正在使用Azure笔记本学习python。最近，我声明要学习MNIST文本识别数据集。每次我关闭服务器并在几个小时不活动后重新启动内核，仅导入MNIST数据集就需要大约10-15分钟。无论如何，内核只需要记住我的数据集，输出，变量，这样就可以为我节省很多时间。谢谢你

浏览 66提问于2019-10-17得票数 0

4回答

如何解决不能从“fetch_openml”导入名称“sklearn.datasets”的问题

我正在学习滑雪，但我不能使用fetch_openml()。上面写着， ImportError:无法从“sklearn.datasets”导入名称“fetch_openml”

浏览 1提问于2019-05-14得票数 2

1回答

如何在pytorch中从MNIST构建自定义数据集

、、、

我将MNIST数据集导入为train_data_MNIST = torchvision.datasets.MNIST(root=path+"MNIST", train=True,transform=transforms, download=True)，并试图从MNIST生成一个较小的数据集，比如前10,000个图像和相应的标签。但我想要的是一个

浏览 15提问于2022-09-02得票数 0

2回答

使用MNIST加载数据集但获取找不到文件错误，Windows 10、Python 3

、、、

我正在尝试使用MNIST库加载MNIST数据集，您可以在https://github.com/sorki/python-mnist中找到该库。问题来了，我甚至不能加载它。from mnist import MNISTimport numpy as np mndata= MNIST(&#x

浏览 235提问于2020-02-02得票数 0

1回答

无法打开文件mnist.h5

、

我正在做一个检测手写字符的项目。我已经导入了很多包。其中一个包keras.models.load_model(mnist.h5)抛出了以下错误： from PIL import ImageGrab, Image model = load_model('mnist<

浏览 0提问于2020-03-08得票数 0

1回答

我在角星有问题，我删除了一些.py文件

、、、

我从几个路径位置删除了一些.py文件和一些fashion_mnist数据集，因为我在下载fashion_mnist数据集时遇到了问题，现在有一些.py文件丢失了，我得到了以下错误：文件C:\Users\legion\AppData\Roaming\Python\Python39\site-packages\tensorflow\keras\datasets_init_导入f

浏览 3提问于2021-05-04得票数 0

回答已采纳

5回答

Scikit-learn -无法在Python中使用fetch_openml加载MNIST原始数据集

、、

我正在尝试用Python加载MNIST原始数据集。sklearn.datasets.fetch_openml函数似乎对此不起作用。这是我使用的代码-dataset = fetch_openml("MNIST Original") File "generateClassifier.py", line 11, in <module>

浏览 6提问于2019-01-25得票数 8

2回答

AttributeError:模块'mnist‘没有属性'train_images’

、、

我在复制freecodecamp.org 的视频!()当他这样做的时候，根本没有问题。() 如果我在Pycharm上尝试了同样的方法，那么我对train_images()没有任何问题

浏览 1提问于2021-05-09得票数 0

1回答

调整Mnist数据集图像大小时的MemoryError

、、、

我是“深入学习”的新手，我正在尝试将mnist图像从28*28更改为224 * 224。(X_train, y_train), (X_test, y_test) = mnist.load_data() x_train_small = tf.image.resizeMemoryError: Unable to allocate 11.2 GiB for an

浏览 5提问于2021-02-04得票数 0

回答已采纳

2回答

我们如何导入MNIST图像而不是数据帧？

、、、、

我正在尝试使用keras在ResNet50上运行MNIST数据集。我陷入了在mnist数据集上使用ImageDatagenerator的部分，因为在keras中可以从目录导入文件。如果我正确理解了data_generator.flow_from_directory，那么它将请求图像的路径作为其第一个参数。然而，我不知道如何输入这些mnist数据

浏览 0提问于2018-04-16得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用导入的MNIST数据集？

1. 导入MNIST数据集

使用Python和TensorFlow/Keras

使用Python和PyTorch

2. 数据预处理

归一化

调整数据维度

3. 构建模型

使用TensorFlow/Keras

使用PyTorch

4. 训练模型

TensorFlow/Keras

PyTorch

5. 评估模型

TensorFlow/Keras

PyTorch

应用场景

可能遇到的问题及解决方法

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐