计算智能 -- BP神经网络（1）

最新推荐文章于 2022-03-27 10:44:48 发布

王嘉凡

最新推荐文章于 2022-03-27 10:44:48 发布

阅读量873

点赞数 1

CC 4.0 BY-SA版权

分类专栏：计算机智能文章标签：计算智能

本文链接：https://blog.youkuaiyun.com/wjf_1997/article/details/78203462

计算机智能专栏收录该内容

2 篇文章

订阅专栏

本文通过Java代码实现了《计算智能》书中BP神经网络的计算流程，包括网络权重和偏置的初始化、激活函数定义、前馈计算、误差反向传播及权重调整。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文实现的是对张军等编写的《计算智能》第二章中的2.4.3引用举例的code实现。

图一
计算智能

图二
应用举例

import java.util.Scanner;

public class Bp {

    private int InputLayer = 3;         //输入层
    private int HiddenLayer = 2;        //隐含层
    private int OutputLayer = 1;        //输出层
    private double LearningRate = 0.9;  //学习率
    private double ExpectedValue = 1;   //预期值
    double [][] Input_Hidden_weights = new double [InputLayer][HiddenLayer];    //输入层到隐含层的权重
    double [][] Hidden_Output_weights = new double [HiddenLayer][OutputLayer];  //隐含层到输出层的权重
    double [] Hidden_polarization = new double[HiddenLayer];    //隐含层的偏置
    double [] Output_polarization = new double[OutputLayer];    //输出层的偏置
    double [] HiddenInputValues = new double[HiddenLayer];      //隐含层的输入值
    double [] HiddenOutputValues = new double[HiddenLayer];     //隐含层的输出值
    double [] OutputInputValues = new double[OutputLayer];      //输出层的输入值
    double [] OutputOutputValues = new double[OutputLayer];     //输出层的输出值
    double [] ErrorHiddenValues = new double[HiddenLayer];      //隐含层的误差值
    double [] ErrorOutputValues = new double[OutputLayer];      //输出层的误差值
    double [][] Adjustment_Input_Hidden_weights = new double [InputLayer][HiddenLayer];  //调整输入层到隐含层的权重
    double [][] Adjustment_Hidden_Output_weights = new double [HiddenLayer][OutputLayer]; //调整隐含层到输出层的权重
    double [] Adjustment_Hidden_polarization = new double [HiddenLayer];  //调整隐含层的偏置
    double [] Adjustment_Output_polarization = new double [OutputLayer]; //调整输出层的偏置


    //一、初始化网络权重和偏置
    void initialize(){

        Scanner in = new Scanner(System.in);

        //（1）输入层到隐含层的连接权重
        System.out.println("请输入输出层到隐含层的连接权重:");
        for (int i = 0 ; i < InputLayer ; i++ ){
            for ( int j = 0 ; j < HiddenLayer; j++ ){
                Input_Hidden_weights[i][j]= in.nextDouble();
            }
        }

        //（2）隐含层到输出层的连接权重
        System.out.println("请输入隐含层到输出层的连接权重:");
        for (int i = 0 ; i < HiddenLayer ; i++ ){
            for ( int j = 0 ; j < OutputLayer; j++ ){
                Hidden_Output_weights[i][j]= in.nextDouble();
            }
        }

        //(3)隐含层的偏置
        System.out.println("请输入隐含层的偏置:");
        for (int i = 0 ; i < HiddenLayer ; i++ ){
            Hidden_polarization[i] = in.nextDouble(); 
        }

        //(4)输出层的偏置
        System.out.println("请输入输出层的偏置:");
        for (int i = 0 ; i < OutputLayer ; i++ ){
            Output_polarization[i] = in.nextDouble(); 
        }   

        System.out.println("*********************************");  
    }

    //二、创建激活函数
    double ActivationFunction(double x){
        return 1/( 1 + Math.pow(Math.E,-x));
    }

    //三、向前传播输入（前馈型网络）
    void Forward( double[] TrainingSamples ){

        //隐含层的总输入和输出
        for(int i = 0; i < HiddenInputValues.length ; i++ ){
            double OutputSumTemp = 0; //临时存放数据
            for(int j = 0; j < TrainingSamples.length; j++ ){
                OutputSumTemp += TrainingSamples[j]*Input_Hidden_weights[j][i];
            }
            HiddenInputValues[i]= OutputSumTemp + Hidden_polarization[i];
            System.out.println("神经元"+(i+4)+"的总输入:");
            System.out.println(HiddenInputValues[i]);
            HiddenOutputValues[i] = ActivationFunction(HiddenInputValues[i]);
            System.out.println("神经元"+(i+4)+"的总输出:");
            System.out.println(HiddenOutputValues[i]);
        }

        //输出层的总输入和输出
        for( int i = 0 ; i < OutputLayer ; i++ ){
            double OutputSumTemp = 0; //临时存放数据
            for(int j = 0; j < HiddenLayer ; j++ ){
                OutputSumTemp += HiddenOutputValues[j]*Hidden_Output_weights[j][i];
            }
            OutputInputValues[i]= OutputSumTemp + Output_polarization[i];
            System.out.println("神经元"+(i+6)+"的总输入:");
            System.out.println(OutputInputValues[i]);
            OutputOutputValues[i] = ActivationFunction(OutputInputValues[i]);
            System.out.println("神经元"+(i+6)+"的总输出:");
            System.out.println(OutputOutputValues[i]);
        }
        System.out.println("*********************************");
    }

    //三、反向误差传播
    void BackWard(){

        //输出层的误差
        for(int i = 0 ; i < OutputLayer ; i++ ){
            ErrorOutputValues[i] = OutputOutputValues[i]*( 1 - OutputOutputValues[i])*( ExpectedValue - OutputOutputValues[i] );
            System.out.println("神经元"+(i+6)+"的误差:");
            System.out.println(ErrorOutputValues[i]);
        }

        //隐含层的误差
        for(int i = HiddenLayer - 1 ; i >= 0 ; i-- ){
            double ErrorTemp = 0; //临时存放数据
            for(int j = 0 ; j < OutputLayer ; j++ ){
                ErrorTemp = HiddenOutputValues[i]*( 1-HiddenOutputValues[i])*ErrorOutputValues[j]*Hidden_Output_weights[i][j];
            }
            ErrorHiddenValues[i] = ErrorTemp;
            System.out.println("神经元"+(i+4)+"的误差:");
            System.out.println(ErrorHiddenValues[i]);
        }

        System.out.println("*********************************");
    }

    //四、网络连接权重和偏置的调整
    void Adjustment(double[] TrainingSamples){

        //(1)调整隐含层到输出层的权重值
        System.out.println("调整隐含层到输出层的连接权重:");
        for(int i = 0 ; i < HiddenLayer ; i++ ){
            double TempWeights = 0; //临时存放数据
            for(int j = 0  ; j < OutputLayer ; j++ ){
                TempWeights = Hidden_Output_weights[i][j]+LearningRate*ErrorOutputValues[j]*HiddenOutputValues[i];
                Adjustment_Hidden_Output_weights[i][j] = TempWeights;
                System.out.println(Adjustment_Hidden_Output_weights[i][j]);
            }
        }

        //(2)调整输入层到隐含层的权重值
        System.out.println("调整输入层到隐含层的权重值:");
        for(int i = 0 ; i < InputLayer ; i++ ){
            double TempWeights = 0; //临时存放数据
            for(int j = 0 ; j < HiddenLayer; j++ ){
                TempWeights = Input_Hidden_weights[i][j]+LearningRate*ErrorHiddenValues[j]*TrainingSamples[i];
                Adjustment_Input_Hidden_weights[i][j] = TempWeights;
                System.out.println(Adjustment_Input_Hidden_weights[i][j]);
            }
        }

        //(3)调整输出层的偏置
        System.out.println("调整输出层的偏置:");
        for(int i = 0; i < OutputLayer; i++ ){
            Adjustment_Output_polarization[i] = Output_polarization[i] + LearningRate * ErrorOutputValues[i];
            System.out.println(Adjustment_Output_polarization[i]);
        }

        //(4)调整隐含层的偏置
        System.out.println("调整隐含层的偏置:");
        for(int i = HiddenLayer - 1 ; i >= 0; i-- ){
            Adjustment_Hidden_polarization[i] = Hidden_polarization[i] + LearningRate * ErrorHiddenValues[i];
            System.out.println(Adjustment_Hidden_polarization[i]);
        }
    }

    //五、判断结束
    void Judge(){

    }

    public static void main(String[] args) {
        // TODO Auto-generated method stub
        Bp bpnn = new Bp();
        bpnn.initialize();
        double[] TrainData = {1,0,1};
        bpnn.Forward(TrainData);
        bpnn.BackWard();
        //如果误差不在容忍的范围内则进行调整
        bpnn.Adjustment(TrainData);
    }
}