tensorflow 神经网络解决二分类问题

本文介绍如何使用TensorFlow构建并训练一个简单的神经网络。包括定义网络结构、设置损失函数及优化算法,并通过实例演示了整个训练过程。
import tensorflow as tf
from numpy.random import RandomState

# 定义训练数据batch大小
batch_size = 8

# 定义神经网络的参数
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))

# 在shape的一个维度上使用None可以方便使用不大的batch大小,在训练时需要把数据分
# 成比较小的batch,但是在测试时,可以一次性使用全部的数据。当数据集比较小时这样比较
# 方便测试,但数据集比价大时,将大量数据放入一个batch可能会导致内存溢出。
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')

# 定义神经网络前向传播的过程
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

# 定义损失函数和反向传播算法
cross_entropy = -tf.reduce_mean(
    y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

# 通过随机数生成一个模型数据集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)

# 定义规则来给出样本的标签。在这里所有x1+x2<1的样例都被认为是正样本(比如零件合格),
# 而其他为负样本(比如零件不合格)。和Tensorflow游乐场中的表示法不大一样的地方是,
# 这里使用0来表示负样本,1来表示正样本。大部分解决分类问题的神经网络都会采用0和1的表示方法。
Y = [[int(x1+x2 < 1)] for (x1, x2) in X ]

# 创建一个会话来运行Tensorflow程序
with tf.Session() as sess:
    init_op = tf.initialize_all_variables()
# 初始化变量
    sess.run(init_op)
    print sess.run(w1)
    print sess.run(w2)

    '''在训练之前神经网络参数的值为:

    '''

# 设定训练的轮数
STEPS = 5000
for i in range(STEPS):
    # 每次选取batch_size个样本进行训练。
    start = (i * batch_size) % dataset_size
    end = min(start+batch_size, dataset_size)

    # 通过选取的样本训练神经网络并更新参数。
    sess.run(train_step,
             feed_dict={x: X[start:end], y_: Y[start:end]})
    if i % 1000 == 0:
        #每隔一段时间计算在所有数据上的交叉熵并输出。
        total_cross_entropy = sess.run(
            cross_entropy, feed_dict={x: X, y_: Y})
        print ("After %d training step(s), cross entropy on all data is % g" % (i, total_cross_entropy))

        '''
        输出结果:

        '''

    print sess.run(w1)
    print sess.run(w2)

    '''
    在训练之后神经网络参数的值:

    '''
上面的程序实现了训练神经网络的全部过程。从中可以总结出训练神经网络的过程可以分为以下3步:
1、定义神经网络的结构和前向传播的过程。
2、定义损失函数以及选择反向传播优化的算法。
3、生成会话(tf.Session)并且在训练数据上反复运行反向传播优化算法。
无论神经网络的结构如何变化,这3个步骤是不变的
### 使用 TensorFlow 实现 BP 神经网络进行二分类 为了实现一个用于二分类的BP神经网络,可以采用Keras API来简化构建过程。下面是一个完整的例子,展示了如何创建、编译并训练一个简单的BP神经网络来进行二分类任务。 #### 导入必要的库 首先导入所需的库: ```python import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Dropout from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler import numpy as np ``` #### 准备数据集 假设有一个特征矩阵`X`和标签向量`y`,其中`y`中的值为0或1表示两个类别。这里使用标准化处理输入数据以提高模型性能: ```python scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # 将数据分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split( X_scaled, y, test_size=0.2, random_state=42) ``` #### 定义模型结构 定义一个多层感知器(MLP),即BP神经网络的一种形式。该网络由多个全连接层组成,并且每层之间应用ReLU激活函数[^2]: ```python model = Sequential([ Dense(64, activation='relu', input_shape=(X.shape[1],)), Dropout(0.5), Dense(32, activation='relu'), Dropout(0.5), Dense(1, activation='sigmoid') # 输出单个节点,使用Sigmoid作为最后一层的激活函数以便于二分类 ]) ``` #### 编译模型 设置损失函数为binary_crossentropy适合解决二元分类问题;优化算法选用Adam;评估指标选择accuracy衡量预测准确性: ```python model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy']) ``` #### 训练模型 指定批量大小(batch size)以及迭代次数(epoch number), 开始拟合模型到训练数据上: ```python history = model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test)) ``` #### 测试模型 最后可以在独立的数据集上来验证所学得的模型表现情况: ```python test_loss, test_acc = model.evaluate(X_test, y_test) print('Test accuracy:', test_acc) ``` 上述代码片段提供了一种基本的方法论去建立基于TensorFlow/Keras平台上的BP神经网络完成二分类的任务。当然实际项目中可能还需要考虑更多因素比如正则化防止过拟合等问题[^3]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值