深度学习入门:mnist分类和boston房价预测的简单实现

本文介绍了使用Python库如PyTorch和Keras进行波士顿房价预测和MNIST数据集的手写数字分类。通过构建单层、多层神经网络,包括使用torch.nn模块简化模型,展示了深度学习在这些任务中的应用和性能提升。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


一.波士顿房价预测

最终测试集上的RMSE为3.0702387288867223

  • 下载数据集:sklearn上boston房价被封了,所以是从网上下载的
import numpy as np
import pandas as pd
import sklearn
import torch
import torch.utils.data as Data
import random

#获取数据集
dataset = pd.read_table('boston.txt', sep='\s+')
dataset=dataset.values

#按照 8:2 的比例划分训练集和测试集
train_size = int(len(dataset) * 0.8)
test_size = len(dataset)-train_size
train_dataset,test_dataset = Data.random_split(dataset,[train_size,test_size])
train_dataset=np.array(train_dataset)
test_dataset=np.array(test_dataset)
train_dataset=torch.tensor(train_dataset,dtype=torch.float32)
test_dataset=torch.tensor(test_dataset,dtype=torch.float32)
print(train_size,test_size)
  • 数据归一化:我用的Z-score标准化
#对数据进行归一化:采取
train_features=train_dataset[:,:13]
train_labels=train_dataset[:,13]
test_features=test_dataset[:,:13]
test_labels=test_dataset[:,13]

train_mean=train_features.mean(axis=0).reshape(1,13)
train_std=train_features.std(axis=0).reshape(1,13)
test_mean=test_features.mean(axis=0).reshape(1,13)
test_std=test_features.std(axis=0).reshape(1,13)

train_features=(train_features-train_mean)/train_std
test_features=(test_features-test_mean)/test_std
  • 定义所需的函数:数据迭代器,线性回归模型,均方差损失函数,随机梯度下降函数
def data_iter(batch_size,features,labels):
    num_examples=len(features)
    indices=list(range(num_examples))
    random.shuffle(indices)
    for i in range(0,num_examples,batch_size):
        batch_indices=torch.tensor(indices[i:min(i+batch_size,num_examples)])
        yield features[batch_indices],labels[batch_indices]
def LinearRegression(X,w,b):
    return torch.mm(X,w)+b
def squared_loss(y_hat,y):
    return (y_hat-y.reshape(y_hat.shape))**2/2
def sgd(params,lr,batch_size):
    with torch.no_grad():
        for param in params:
            param -= lr * param.grad /batch_size
            param.grad.zero_()
  • 设置基本参数并直接开始优化w,b:
lr=0.01 #学习率
num_epochs=3 #整体迭代次数
batch_size=10 #每次使用的数据批量
net=LinearRegression
loss=squared_loss #使用的模型是线性回归模型
#初始化w,b
w=torch.normal(0,1,(13,1),requires_grad=True)
b=torch.zeros(1,requires_grad=True)

loss_y=[]#用于记录loss的数据画图


for epoch in range(num_epochs):
    for X,y in data_iter(batch_size,train_features,train_labels):
        y_hat=net(X,w,b)
        l=loss(y_hat,y)
        l.sum().backward()
        sgd((w,b),lr,batch_size)
    with torch.no_grad():#每次数据集整体迭代完后,计算整体的损失函数
        train_l = loss(net(train_features, w, b),train_labels)
        loss_y.append(train_l.detach().sum())
        print(f'epoch {
     epoch + 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

洪小帅

靓仔靓女看过来~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值