神经网络BP网络的c++实现

最新推荐文章于 2024-07-29 19:36:57 发布

bishen

最新推荐文章于 2024-07-29 19:36:57 发布

阅读量412

点赞数

CC 4.0 BY-SA版权

分类专栏：算法及神经网络相关

本文链接：https://blog.youkuaiyun.com/bishen/article/details/8217396

算法及神经网络相关专栏收录该内容

3 篇文章

订阅专栏

本文介绍了一种基于C++语言实现的BP神经网络算法，包括详细的程序结构和关键步骤说明。该实现涵盖从初始化权值到批量学习的完整过程，并通过实际案例展示了算法的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

神经网络算法BP网络的C++实现

头文件CBp.h

#ifndef BP_H
#define BP_H
//初始化相关变量
#define N 4    //学习样本个数
#define IN 2  //输入层神经元数目
#define HN 8 //隐层神经元数目
#define ON 1 //输出层神经元数目
double P[IN]; //单个样本输入数据
double T[ON]; //单个样本教师数据

double W[HN][IN]; //输入层至隐层权值
double V[ON][HN]; //隐层至输出层权值

double X[HN]; //隐层的输入
double Y[ON]; //输出层的输入
double H[HN]; //隐层的输出
double O[ON]; //输出层的输出

double YU_HN[HN]; //隐层的阈值
double YU_ON[ON]; //输出层的阈值

double err_m[N]; //第m个样本的总误差

double a; //输出层至隐层的学习效率
double b; //隐层至输入层学习效率
double alpha;//动量系数

//定义一个放学习样本的结构
struct {
	double input[IN]; //一个学习样本	
	double teach[ON]; //一个期望信号
}Study_Data[N];//学习样本的个数


#endif

实现文件CBp.cpp

#include <iostream>
#include <iomanip>
#include <cstdlib>
#include <cmath>
#include <cstdio>
#include <ctime>
#include <fstream>
#include "bp.h"
using namespace std;

//初始化-阈值
void initial();
//从文件中获取训练样本
void GetTrainingData();
//输入学习样本
void input_P(int);
//输入期望样本
void input_T(int);
//隐层的输出
void H_I_O();
//输出层的输出
void O_I_O();

//误差子程序
void Err_O_H(int);
//误差子程序

void Err_H_I();
//N个样本的全局误差计算子程序Batch Learning 批量学习法
double Err_Sum();
//输出层至隐层的权值调整程序
void Delta_O_H(int);
//隐层至输入层的权值调整、隐层阈值调整计算子程序
void Delta_H_I(int);

//最后的调整结果保存到文件中
void save();

int main()
{
	char c;
	double sum_err;//批量学习后的总误差
	int study=0; //学习训练的次数

	a = 0.7;//定义输出层至隐层的学习率
	b = 0.7;//定义隐层至输入层的学习率
	alpha=0.1;
	
	double 	Pre_error = 0.001; //预定误差 停止条件

	GetTrainingData();//从文件中获取输入的数据及期望的信号
	initial(); //隐层、输出层权、阈值初始化 (1) 
	do
	{
		++study; //统计学习次数
		for (int m=0;m<N;m++) 
		{
			input_P(m); //输入第m个学习样本 (2)
			input_T(m);//输入第m个样本的教师信号 (3)
			H_I_O(); //第m个学习样本隐层各单元输入、输出值 (4)
			O_I_O(); //第m个学习样本输出层各单元输入、输出值 (5)
			Err_O_H(m); //第m个学习样本输出层至隐层一般化误差 (6) 
			Err_H_I(); //第m个学习样本隐层至输入层一般化误差 (7)
			Delta_O_H(m); //第m个学习样本输出层至隐层权阈值调整、修改 (8)
			Delta_H_I(m); //第m个学习样本隐层至输入层权阈值调整、修改 (9)
		} //全部样本训练完毕
			sum_err=Err_Sum(); //全部样本全局误差计算 (10)
			cout<<"第"<<study<<"次学习的均方误差为"<<sum_err<<endl;
		
	}while (sum_err > Pre_error); 

	cout<<"网络已经学习了"<<study<<"次,学习的均方误差为"<<sum_err<<endl;
	save();

	/* 以下为学习后的测试过程 */

    do{	   
	    cout<<"请输入想测试的样本: "<<endl;
	   for(int i=0;i<IN;i++)
	   { 
		  
		   cin>>P[i];
	   }

	   for(int j=0;j<IN;j++)
	   { 
		   
		   cout<<P[j]<<" ";
	   }
    	H_I_O();
    	O_I_O();

		for (int k=0;k<ON;k++)
		{
			cout<<O[k];
		//	if(key == 1)
		//	{
		//		cout<<"我猜你是女生..."<<"退出请输q"<<endl;
		//	}
		//	else
		//	{
		//	cout<<"我猜你是男生...."<<"退出请输q"<<endl;
		//	}
		}
}while( (c=getchar())!='q') ;

	return 0;
}

//初始化权、阈值函数/////
///////////////////////////
void initial()
{
//隐层权、阈值初始化//
	srand( (unsigned)time( NULL ) );//给随机函数一个随机种子

	for(int i=0;i<HN;i++)
	{
		for(int j=0;j<IN;j++)
			W[i][j]= (double)((rand()/32767.0)*2-1); //初始化输入层到隐层的权值，随机模拟-1到1之间的值	
	}

	for(int ii=0;ii<ON;ii++)
	{
		for(int jj=0;jj<HN;jj++)
			V[ii][jj]= (double)((rand()/32767.0)*2-1); //初始化隐层到输出层的权值，随机模拟-1到1之间的值
	}

	for(int k=0;k<HN;k++)
	{
		YU_HN[k] = (double)((rand()/32767.0)*2-1);  //隐层阈值初始化 
	}

	for(int kk=0;kk<ON;kk++)
	{
		YU_ON[kk] = (double)((rand()/32767.0)*2-1); //输出层阈值初始化 
	}
  
}

//从文件中读取训练样本数据到结构体中//
void GetTrainingData()
{
	ifstream GetTrainingData ( "sample.txt", ios::in );
	
	for(int m=0;m<N;m++)
	{
		for(int i=0;i<IN;i++)
		{
			GetTrainingData>>Study_Data[m].input[i];  //取得输入数据
		}
		for(int j=0;j<ON;j++)
		{
			GetTrainingData>>Study_Data[m].teach[j];  //取得输出数据
		}
	}
	
	GetTrainingData.close();
}

////////////////////////////////
////第m个学习样本输入子程序///
///////////////////////////////
void input_P(int m)
{
	for (int i=0;i<IN;i++)//有IN个输入层
	 P[i]=Study_Data[m].input[i];
	//获得第m个样本的数据
}//子程序input_P(m）结束

/////////////////////////////
////第m个样本期望信号子程序//
/////////////////////////////
void input_T(int m)
{
	for (int k=0;k<ON;k++)       //ON为修改过的(m)
	 T[k]=Study_Data[m].teach[k];
}//子程序input_T(m)结束


/////////////////////////////////
//隐层各单元输入、输出值子程序///
/////////////////////////////////
void H_I_O(){
	double sigma=0.0;
	int i,j;
	for (j=0;j<HN;j++)
	{
		for (i=0;i<IN;i++)
				sigma+=W[j][i]*P[i]; //求隐层内积/P[i]为样本输入的数据

			      X[j]=sigma;
				//暂不用阀值//X[j]=sigma - YU_HN[i];//求隐层净输入，为什么减隐层的阀值   X[HN]; //隐层的输入
					H[j]=1.0/(1.0+exp(-X[j]));//求隐层输出 siglon函数
	}
}//子程序H_I_O()结束


///////////////////////////////////
//输出层各单元输入、输出值子程序///
///////////////////////////////////
void O_I_O()
{
	double  sigma=0.0;
	for (int k=0;k<ON;k++)
	{
		
		 for (int j=0;j<HN;j++)
		 {
			sigma+=V[k][j]*H[j];//求输出层内积//修改过H[k]改为H[j]
		 }
		 Y[k]=sigma;
		//Y[k]=sigma-YU_ON[k]; //求输出层净输入
		O[k]=1.0/(1.0+exp(-Y[k]));//求输出层O[k]输出
	}
}//子程序O_I_O()结束


////////////////////////////////////
//反向传播--输出层至隐层的一般化误差子程序////
////////////////////////////////////
double d_err[ON];
void Err_O_H(int m)//第m个样本的误差程序
{
	double abs_err[ON];   //每个样本的绝对误差都是从0开始的
	double sqr_err=0;      //每个样本的平方误差计算都是从0开始的
	for (int k=0;k<ON;k++)
	{
		     abs_err[k]=T[k]-O[k];    //求第m个样本下的第k个神经元的绝对误差
	    	sqr_err+=(abs_err[k])*(abs_err[k]);//求第m个样本下输出层的平方误差

		    d_err[k]=abs_err[k]*O[k]*(1.0-O[k]);//d_err[k]输出层各神经元的一般化误差
	}

	err_m[m]=sqr_err/2;//第m个样本下输出层的平方误差/2=第m个样本的均方误差

}//子程序Err_O_H(m)结束

////////////////////////////////////////////////////////
//输出层至隐层的权值调整、输出层阈值调整计算子程序//////
////////////////////////////////////////////////////////
void Delta_O_H(int m)
{
	
	for (int k=0;k<ON;k++){
		for (int j=0;j<HN;j++)
		{
			V[k][j]+=a*d_err[k]*H[j];//输出层至隐层的权值调整
		}
		//YU_ON[k]+=a*d_err[k];//输出层至隐层的阈值调整
	}
	
}//子程序Delta_O_H()结束


////////////////////////////////////
//隐层至输入层的一般化误差子程序////
////////////////////////////////////
double e_err[HN];
void Err_H_I()
{
	double sigma=0.0;
	for (int j=0;j<HN;j++)
	{
			  for (int k=0;k<ON;k++) 
			  {
				  sigma=d_err[k]*V[k][j];
			  }

		e_err[j]=sigma*H[j]*(1-H[j]);//	e_err[j]为局部梯度  隐层各神经元的一般化误差
	}
}//子程序Err_H_I()结束




/////////////////////////////////////////////////////
//隐层至输入层的权值调整、隐层阈值调整计算子程序/////
/////////////////////////////////////////////////////
void Delta_H_I(int m)
{
for (int j=0;j<HN;j++){
	for (int i=0;i<IN;i++) 
	{
		W[j][i]+=b*e_err[j]*P[i];//隐层至输入层的权值调整P[i]为输入层数据
	}
//YU_HN[j]+=b*e_err[j];
}
}//子程序Delta_H_I()结束



/////////////////////////////////
//N个样本的全局误差计算子程序Batch Learning 批量学习法////
/////////////////////////////////
double Err_Sum()
{
double total_err=0;
for (int m=0;m<N;m++) {
  total_err+=err_m[m];//每个样本的均方误差加起来就成了全局误差
}
return total_err;
}//子程序Err_sum()结束





///保存权值最后调整的结果///
//////////////////////////////////
void save()
{
	ofstream outQuanFile( "weight.txt", ios::out );
	ofstream outYuFile( "bias.txt", ios::out );
	outQuanFile<<"最后调整得到输入层至隐藏层的权值分别为：\n";
	for(int i=0;i<HN;i++)
	{
		for(int j=0;j<IN;j++)
		{
			outQuanFile<<"W["<<i<<"]["<<j<<"]="<<W[i][j]<<"   ";
		}
		outQuanFile<<"\n";
	}
	outQuanFile<<"最后调整得到隐藏层至输出层的权值分别为：\n";
	for(int ii=0;ii<ON;ii++)
	{
		for(int jj=0;jj<HN;jj++)
		{
			outQuanFile<<"V["<<ii<<"]["<<jj<<"]="<<V[ii][jj]<<"   ";
		}
		outQuanFile<<"\n";
	}
	outYuFile<<"输出层的阈值为:\n";
	for(int k=0;k<ON;k++)
	{
		outYuFile<<YU_ON[k]<<"  ";  //输出层阈值写入文本
	}
	outYuFile<<"\n隐层的阈值为:\n";
	for(int kk=0;kk<HN;kk++)
	{
		outYuFile<<YU_HN[kk]<<"  ";  //隐层阈值写入文本
	}
	outQuanFile.close();
}