机器学习笔记

本文介绍了机器学习中的关键概念,如训练集、测试集和验证集,以及经验误差和泛化误差。着重讲解了过拟合与欠拟合,学习率的概念,以及线性模型和BP算法(误差逆传播算法)的原理与应用。通过Python实现了一个简单的神经网络实例,演示了如何用BP算法进行权重和阈值的更新。

机器学习暑假任务(一)

关键名词解释

训练集:训练数据模型的数据集。
测试集:评估模型性能P的数据集
验证集:模型训练过程中留出的样本集,它可以用于调整模型的超参数和评估模型的能力。
经验误差:模型在训练集上表现出的误差
泛化误差:新输入数据的误差期望。通常通过在测试集上的性能来评估泛化误差
欠拟合:模型不能再训练集上获得足够低的误差;
过拟合(overfitting):训练误差和测试误差的差距太大
学习率:梯度下降法中,用于控制步长的一个参数,过大,模型不收敛,发散或者震荡,过小,梯度下降收敛很慢

线性模型

BP算法(误差逆传播算法)

5.3公式推导

个人理解

BP算法主要分为开始的正向传播(参数随机初始化)和误差反向传播(核心就是根据误差进行更新权值和阈值)

正向传播: 是指输入样本从输入层进入网络,经隐层逐层传递至输出层,得到输出层的实际输出与期望输出的误差。

误差反向传播: 是指将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。

不断重复此过程,权值不断调整的过程,也即网络的学习训练过程。直到达到终止条件(可以是学习次数,也可以是特定时间等等);

最终神经网络学到的东西,也就蕴含在每一个连接权值与阈值中。

神经网络

python编程实现用人工神经网络挑选好瓜

# -*- coding: utf-8 -*-
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt

seed = 2020
import random

np.random.seed(seed)  # Numpy module.
random.seed(seed)  # Python random module.

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
plt.close('all')

# 数据预处理
def preprocess(data):
    # 将非数映射数字
    for title in data.columns:
        if data[title].dtype == 'object':
            encoder = LabelEncoder()
            data[title] = encoder.fit_transform(data[title])
            # 去均值和方差归一化
    ss = StandardScaler()
    X = data.drop('好瓜', axis=1)
    Y = data['好瓜']
    X = ss.fit_transform(X)
    x, y = np.array(X), np.array(Y).reshape(Y.shape[0], 1)
    return x, y

# 定义Sigmoid
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# 求导
def d_sigmoid(x):
    return x * (1 - x)

# 标准BP算法
def standard_BP(x, y, dim=10, eta=0.8, max_iter=500):
    n_samples = 1
    # 随机初始化参数 矩阵形式
    w1 = np.random.random((x.shape[1], dim))
    w2 = np.random.random((dim, 1))
    b1 = np.random.random((n_samples, dim))
    b2 = np.random.random((n_samples, 1))
    # 保存损失
    losslist = []
    for ite in range(max_iter):
        loss_per_ite = []
        for m in range(x.shape[0]):
            xi, yi = x[m, :], y[m, :]
            xi, yi = xi.reshape(1, xi.shape[0]), yi.reshape(1, yi.shape[0])
            # 前向传播
            u1 = np.dot(xi, w1) + b1
            out1 = sigmoid(u1)
            u2 = np.dot(out1, w2) + b2
            out2 = sigmoid(u2)
            loss = np.square(yi - out2) / 2
            loss_per_ite.append(loss)
            print('standard BP---iter:%d  loss:%.4f' % (ite, loss))
            # 反向传播
            g = (yi - out2) * d_sigmoid(out2) # g 式
            d_w2 = np.dot(np.transpose(out1), g) # 即输出层与隐层 权值更新
            d_b2 = -g # 即输出层 阈值更新
            
            d_out1 = np.dot(g, np.transpose(w2)) # 对隐层 输出求导 
            e = d_out1 * d_sigmoid(out1) # e 式
            
            d_w1 = np.dot(np.transpose(xi), e)  # 即输入层与隐层 权值更新
            d_b1 = -e # 隐层 阈值 更新
            # 更新
            w1 = w1 + eta * d_w1
            w2 = w2 + eta * d_w2
            b1 = b1 + eta * d_b1
            b2 = b2 + eta * d_b2
        losslist.append(np.mean(loss_per_ite))
        
    # Loss可视化
    plt.figure()
    ##补充Loss可视化代码
    plt.plot([i + 1 for i in range(max_iter)], losslist)
    plt.legend(['standard  BP'])
    plt.xlabel('iteration')
    plt.ylabel('loss')
    plt.show()
    return w1, w2, b1, b2
    
def predict(x,w1,w2,b1,b2):
    alpha = np.dot(x, w1)  #隐层输入
    b=sigmoid(alpha-b1)#隐层输出
    beta=np.dot(b,w2)  #输出层
    Y=sigmoid(beta-b2) #输出层结果
    return Y
【语音分离】基于平均谐波结构建模的无监督单声道音乐声源分离(Matlab代码实现)内容概要:本文介绍了基于平均谐波结构建模的无监督单声道音乐声源分离方法,并提供了相应的Matlab代码实现。该方法通过对音乐信号中的谐波结构进行建模,利用音源间的频率特征差异,实现对混合音频中不同乐器或人声成分的有效分离。整个过程无需标注数据,属于无监督学习范畴,适用于单通道录音场景下的语音与音乐分离任务。文中强调了算法的可复现性,并附带完整的仿真资源链接,便于读者学习与验证。; 适合人群:具备一定信号处理基础和Matlab编程能力的高校学生、科研人员及从事音频处理、语音识别等相关领域的工程师;尤其适合希望深入理解声源分离原理并进行算法仿真实践的研究者。; 使用场景及目标:①用于音乐音频中人声与伴奏的分离,或不同乐器之间的分离;②支持无监督条件下的语音处理研究,推动盲源分离技术的发展;③作为学术论文复现、课程项目开发或科研原型验证的技术参考。; 阅读建议:建议读者结合提供的Matlab代码与网盘资料同步运行调试,重点关注谐波建模与频谱分解的实现细节,同时可扩展学习盲源分离中的其他方法如独立成分分析(ICA)或非负矩阵分解(NMF),以加深对音频信号分离机制的理解。
内容概要:本文系统介绍了新能源汽车领域智能底盘技术的发展背景、演进历程、核心技术架构及创新形态。文章指出智能底盘作为智能汽车的核心执行层,通过线控化(X-By-Wire)和域控化实现驱动、制动、转向、悬架的精准主动控制,支撑高阶智能驾驶落地。技术发展历经机械、机电混合到智能三个阶段,当前以线控转向、线控制动、域控制器等为核心,并辅以传感器、车规级芯片、功能安全等配套技术。文中还重点探讨了“智能滑板底盘”这一创新形态,强调其高度集成化、模块化优势及其在成本、灵活性、空间利用等方面的潜力。最后通过“2025智能底盘先锋计划”的实车测试案例,展示了智能底盘在真实场景中的安全与性能表现,推动技术从研发走向市场验证。; 适合人群:汽车电子工程师、智能汽车研发人员、新能源汽车领域技术人员及对智能底盘技术感兴趣的从业者;具备一定汽车工程或控制系统基础知识的专业人士。; 使用场景及目标:①深入了解智能底盘的技术演进路径与系统架构;②掌握线控技术、域控制器、滑板底盘等关键技术原理与应用场景;③为智能汽车底盘研发、系统集成与技术创新提供理论支持与实践参考。; 阅读建议:建议结合实际车型和技术标准进行延伸学习,关注政策导向与行业测试动态,注重理论与实车验证相结合,全面理解智能底盘从技术构想到商业化落地的全过程。
【顶级EI复现】计及连锁故障传播路径的电力系统 N-k 多阶段双层优化及故障场景筛选模型(Matlab代码实现)内容概要:本文介绍了名为《【顶级EI复现】计及连锁故障传播路径的电力系统 N-k 多阶段双层优化及故障场景筛选模型(Matlab代码实现)》的技术资源,重点围绕电力系统中连锁故障的传播路径展开研究,提出了一种N-k多阶段双层优化模型,并结合故障场景筛选方法,用于提升电力系统在复杂故障条件下的安全性与鲁棒性。该模型通过Matlab代码实现,具备较强的工程应用价值和学术参考意义,适用于电力系统风险评估、脆弱性分析及预防控制策略设计等场景。文中还列举了大量相关的科研技术支持方向,涵盖智能优化算法、机器学习、路径规划、信号处理、电力系统管理等多个领域,展示了广泛的仿真与复现能力。; 适合人群:具备电力系统、自动化、电气工程等相关背景,熟悉Matlab编程,有一定科研基础的研究生、高校教师及工程技术人员。; 使用场景及目标:①用于电力系统连锁故障建模与风险评估研究;②支撑高水平论文(如EI/SCI)的模型复现与算法验证;③为电网安全分析、故障传播防控提供优化决策工具;④结合YALMIP等工具进行数学规划求解,提升科研效率。; 阅读建议:建议读者结合提供的网盘资源,下载完整代码与案例进行实践操作,重点关注双层优化结构与场景筛选逻辑的设计思路,同时可参考文档中提及的其他复现案例拓展研究视野。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值