机器学习-线性回归,局部加权线性回归和岭回归

本文基于《机器学习实战》书籍,探讨线性回归、局部加权线性回归和岭回归。通过读取'abalone.txt'数据集,实现了线性回归并计算了误差平方和。接着在'ex0.txt'数据集上应用局部线性回归,选择最佳的sigma值以优化模型性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考书籍:
《机器学习实战》
相关数学推导知识笔记见我上传的手写pdf

任务:
1)读取数据集’abalone.txt’,输出线性回归最佳参数以及预测值和真实值的误差平方和。

2)读取数据集’ex0.txt’,将数据集分成合适的训练集和测试集,用局部线性回归模型训练数据,选取你认为最佳sigma数值,并说明原因。 提示:分离训练集和测试集代码可参考。


from numpy import *
import matplotlib.pyplot as plt
def loadDataSet(fileName):      #general function to parse tab -delimited floats
    numFeat = len(open(fileName).readline().split('\t')) - 1 #get number of fields 
    dataMat = []; labelMat = []
    fr = open(fileName)
    for line in fr.readlines():
        lineArr =[]
        curLine = line.strip().split('\t')
        for i in range(numFeat):
            lineArr.append(float(curLine[i]))
        dataMat.append(lineArr)
        labelMat.append(float(curLine[-1]))
    return dataMat,labelMat

最小二乘模块:

def standRegres(xArr,yArr):
    xMat = mat(xArr); yMat = mat(yArr).T
    xTx = xMat.T*
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值