BPNN

本文介绍了一个简单的BP神经网络实现过程,包括前向传播预测、误差反向传播训练等核心步骤,并通过一个具体示例展示了如何使用该网络进行训练和预测。
import random
import math
random.seed(0)

def rand(b, a):
    return (b-a)*random.random()+a


def make_matrix(m,  n,  fill=0.0):  # 创造一个指定大小的矩阵
    mat = []

    print([fill]*10)
    for i in range(m):
        mat.append([fill] * n)
    return mat


def sigmoid(x):
    return 1.0 / (1.0+math.exp(-x))


def sigmod_derivate(x):
    return x*(1-x)


class Bpnn:
    def __init__(self):
        self.input_n = 0
        self.hidden_n = 0
        self.output_n = 0
        self.input_cells = []
        self.hidden_cells = []
        self.output_cells = []
        self.input_weights = []
        self.output_weights = []
        self.input_correction = []
        self.output_correction = []


    def setup(self, ni,  nh, no):
        self.input_n = ni + 1    # input 神经元数
        self.hidden_n = nh      # 隐藏层神经元数
        self.output_n = no      # 输出层神经元数
        # init cells
        self.input_cells = [1.0] * self.input_n  #
        self.hidden_cells = [1.0] * self.hidden_n
        self.output_cells = [1.0] * self.output_n
        # init weights
        self.input_weights = make_matrix(self.input_n,  self.hidden_n)  # 0 矩阵
        self.output_weights = make_matrix(self.hidden_n,  self.output_n)
        # random activate
        for i in range(self.input_n):
            for h in range(self.hidden_n):
                self.input_weights[i][h] = rand(-0.2,  0.2)
        for h in range(self.hidden_n):
            for o in range(self.output_n):
                self.output_weights[h][o] = rand(-2.0, 2.0)
        # init correction matrix
        self.input_correction = make_matrix(self.input_n,  self.hidden_n)
        self.output_correction = make_matrix(self.hidden_n,  self.output_n)


    def predict(self,  inputs):
        # activate input layer
        for i in range(self.input_n - 1):
            self.input_cells[i] = inputs[i]
        # activate hidden layer
        for j in range(self.hidden_n):
            total = 0.0
            for i in range(self.input_n):
                total += self.input_cells[i] * self.input_weights[i][j]
            self.hidden_cells[j] = sigmoid(total)

        # activate output layer
        for k in range(self.output_n):
            total = 0.0
            for j in range(self.hidden_n):
                total += self.hidden_cells[j] * self.output_weights[j][k]
            self.output_cells[k] = sigmoid(total)
        return self.output_cells[:]

    def back_propagate(self,  case,  label,  learn,  correct):
        # feed forward
        self.predict(case)
        # get output layer error
        output_deltas = [0.0] * self.output_n
        for o in range(self.output_n):
            error = label[o] - self.output_cells[o]
            output_deltas[o] = sigmod_derivate(self.output_cells[o]) * error
        # get hidden layer error
        hidden_deltas = [0.0] * self.hidden_n
        for h in range(self.hidden_n):
            error = 0.0
            for o in range(self.output_n):
                error += output_deltas[o] * self.output_weights[h][o]
            hidden_deltas[h] = sigmod_derivate(self.hidden_cells[h]) * error
        # update output weights
        for h in range(self.hidden_n):
            for o in range(self.output_n):
                change = output_deltas[o] * self.hidden_cells[h]
                self.output_weights[h][o] += learn * change + correct * self.output_correction[h][o]
                self.output_correction[h][o] = change
        # update input weights
        for i in range(self.input_n):
            for h in range(self.hidden_n):
                change = hidden_deltas[h] * self.input_cells[i]
                self.input_weights[i][h] += learn * change + correct * self.input_correction[i][h]
                self.input_correction[i][h] = change
        # get global error
        error = 0.0
        for o in range(len(label)):
            error += 0.5 * (label[o] - self.output_cells[o]) ** 2
        return error

    def train(self,  cases,  labels,  limit=10000,  learn=0.05,  correct=0.1):
        for i in range(limit):
            error = 0.0
            for i in range(len(cases)):
                label = labels[i]
                case = cases[i]
                error += self.back_propagate(case,  label,  learn, correct)

    def tests(self):

        cases = [
                [0, 0],
                [0, 1],
                [1, 0],
                [1, 1],
            ]
        labels = [[0],  [1],  [1], [0]]
        self.setup(2,  5,  1)
        self.train(cases,  labels,  10000,  0.05,  0.1)
        for case in cases:
            print(self.predict(case))


if __name__ == '__main__':
     mm = Bpnn()
     mm.tests()

### BPNN预测的实现方法及常见问题解决方案 BP神经网络(Back Propagation Neural Network,简称BPNN)是一种基于误差反向传播算法的神经网络模型。其核心思想是通过不断调整网络中的权重和阈值,以最小化实际输出与期望输出之间的误差,从而实现回归预测任务[^2]。 #### 1. BPNN预测的实现方法 BPNN预测的实现通常包括以下几个关键步骤: - **数据预处理**:在训练BPNN之前,需要对输入数据进行归一化处理,以确保数据分布一致,减少训练难度。常用的方法包括线性归一化、Z-score标准化等。 - **网络结构设计**:BPNN的结构通常包括输入层、隐藏层和输出层。隐藏层的层数和神经元数量需要根据具体问题确定。一般来说,增加隐藏层或神经元数量可以提高模型的表达能力,但也可能导致过拟合[^3]。 - **初始化参数**:BPNN的权重和偏置通常需要随机初始化。初始值的选择会影响训练过程的收敛速度和结果。 - **训练过程**:使用梯度下降法或其他优化算法调整权重和偏置,使得目标函数(通常是均方误差)达到最小值。训练过程中需要注意学习率的设置,避免过大导致震荡或过小导致收敛缓慢。 - **验证与测试**:将训练好的模型应用于验证集和测试集,评估其泛化性能。如果模型在测试集上的表现不佳,可能需要调整网络结构或重新训练。 ```matlab % 示例代码:基于MATLAB的BPNN实现 clear; clc; % 数据加载与预处理 load your_data.mat; % 假设数据已存储为your_data.mat inputs = normalize(data(:, 1:end-1)); % 输入数据归一化 targets = data(:, end); % 输出目标 % 创建BPNN net = feedforwardnet([10]); % 设置隐藏层神经元数为10 net.divideParam.trainRatio = 0.7; net.divideParam.valRatio = 0.15; net.divideParam.testRatio = 0.15; % 训练网络 net = train(net, inputs', targets'); % 测试网络 outputs = net(inputs'); errors = gsubtract(targets', outputs); performance = perform(net, targets', outputs); disp(['网络性能: ', num2str(performance)]); ``` #### 2. BPNN预测中的常见问题及解决方案 - **局部最优解**:传统BPNN容易陷入局部最优解,导致预测精度不足。可以通过引入全局优化算法(如遗传算法GA、粒子群优化PSO)来优化初始权重和偏置,从而避免局部最优[^4]。 - **过拟合**:当网络过于复杂或训练时间过长时,可能会出现过拟合现象。解决方法包括增加正则化项、使用早停策略(Early Stopping)、减少隐藏层神经元数量等。 - **训练速度慢**:BPNN的训练速度较慢,尤其是在处理大规模数据时。可以通过改进优化算法(如Adam、RMSprop)或采用并行计算技术来加速训练。 - **参数选择困难**:BPNN的性能高度依赖于网络结构和超参数的选择。建议通过交叉验证或网格搜索等方法寻找最佳参数组合。 #### 3. 混合优化方法的应用 为了克服传统BPNN的缺陷,可以结合其他优化算法进行改进。例如,引用中提到的混合遗传算法和蚁群算法优化的BP神经网络(GA-ACO-BPNN)能够显著提升预测精度和训练速度[^1]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值