python解析MNIST数据集(IDX格式)

这篇博客介绍了如何使用Python解析MNIST数据集的IDX格式。通过下载数据,解压文件,然后在Jupyter Notebook中加载并分析测试集,揭示了测试集中包含10000个样本,每个样本的特征向量为784维,对应的labels存储了0-9的分类类别。

下载 地址:http://yann.lecun.com/exdb/mnist/
解压 如图
在这里插入图片描述上传 使用的是Jupyter Notebook,所以有这一步,其他编辑器自己考虑路径
代码

import os
import struct
import numpy as np
def read_mnist(labels_path,images_path):
    with open(labels_path, 'rb') as lbpath:
        magic, n = struct.unpack('>II',
                                 lbpath.read(8))
        labels = np.fromfile(lbpath,
                             dtype=np.uint8)

    with open(images_path, 'rb') as imgpath:
        magic, num, rows, cols = struct.unpack('>IIII',
                                               imgpath.read(16))
        images = np.fromfile(imgpath,
                             dtype=np.uint8).reshape(len(labels), 784)

    return images, labels

labels_path = 't10k-labels.idx1-ub
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值