神经网络：网络模型构建

最新推荐文章于 2025-03-02 03:59:03 发布

00&00

最新推荐文章于 2025-03-02 03:59:03 发布

阅读量829

点赞数 12

分类专栏：深度学习人工智能文章标签：神经网络 tensorflow 深度学习

本文链接：https://blog.youkuaiyun.com/Wei_sx/article/details/144931360

版权

人工智能同时被 2 个专栏收录

223 篇文章

订阅专栏

深度学习

82 篇文章

订阅专栏

构建神经网络模型的方式可以多种多样，具体的方式取决于所采用的框架、网络的架构类型及其应用。以下是构建神经网络模型的一些常用方式和示例，主要以 Python 中的 Keras/TensorFlow 进行介绍。

1. 序贯模型

使用 Keras 的序贯模型（Sequential Model）是最简单直观的构建神经网络方式。序贯模型适合于层与层之间按顺序堆叠的情况。以下是对使用序贯模型的详细介绍，包括其定义、基本操作以及示例。

1.1 序贯模型的概念

Sequential 类允许您逐层添加模型的结构。每一层都是提供输入和输出的一组神经元，可以是任意形式，适合处理简单的前馈神经网络。访问 Sequential 模型的好处在于它简单易用，非常适合初学者和快速原型设计。

1.2 如何使用序贯模型

步骤：
步骤1 导入所需的库：通常需要导入 `tensorflow` 和 `keras` 的相应模块。
步骤2 创建模型实例：使用 `keras.Sequential()`。
步骤3 添加层：使用 `add()` 方法添加所需的层。
步骤4 编译模型：使用 `compile()` 方法指定损失函数、优化器和评估指标。
步骤5 训练模型：使用 `fit()` 方法进行模型训练。
步骤6 评估模型：使用 `evaluate()` 方法在测试集上评估模型性能。
步骤7 进行预测：使用 `predict()` 方法进行所有后续的预测。

1.3 示例：使用sequential构建如下图所示的神经⽹络模型

方法1：

# 导入模块
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

# 创建模型示例
model = keras.Sequential()
# 添加输入层和第一个隐藏层
model.add(layers.Dense(3,activation='relu',kernel_initializer='he_normal',name='layers1',input_shape=(3,)))
# 添加第二个隐藏层  
model.add(layers.Dense(2,activation='relu',kernel_initializer='he_normal',name='layers2'))
# 添加输出层，使用 softmax 激活函数进行多类分类  
model.add(layers.Dense(2,activation='softmax'))

方法2：

# 导入模块
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

# 定义⼀个Sequential模型，包含3层 
model = keras.Sequential(
    [
        # 第⼀层：激活函数为relu,权重初始化为he_normal 
        layers.Dense(3,activation='relu',kernel_initializer='he_normal',name='layer1',input_shape=(3,)),
       # 第⼆层：激活函数为relu,权重初始化为he_normal 
        layers.Dense(2,activation='relu',kernel_initializer='he_normal',name='layer2'),
        # 第三层（输出层）：激活函数为sigmoid,权重初始化为he_norml
        layers.Dense(2,activation='sigmoid',kernel_initializer='he_normal',name='layer3')
    ],
    name = 'my_Sequential'
)

1.4 示例：使用序贯模型构建神经网络

以下是一个使用 Keras 序贯模型构建简单数字分类网络（以 MNIST 数据集为例）的示范。

# 1 导入必要的库
import tensorflow as tf  
from tensorflow import keras  
from tensorflow.keras import layers

# 2 加载和预处理数据
# 加载 MNIST 数据集  
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()  

# 数据预处理：展平和归一化  
x_train = x_train.reshape(-1, 28 * 28).astype('float32') / 255  
x_test = x_test.reshape(-1, 28 * 28).astype('float32') / 255  

# 将标签进行独热编码  
y_train = keras.utils.to_categorical(y_train, 10)  
y_test = keras.utils.to_categorical(y_test, 10)

# 3 创建序贯模型
# 创建模型实例  
model = keras.Sequential()  

# 添加输入层和第一个隐藏层  
model.add(layers.Dense(128, activation='relu', input_shape=(28 * 28,)))  

# 添加第二个隐藏层  
model.add(layers.Dense(64, activation='relu'))  

# 添加输出层，使用 softmax 激活函数进行多类分类  
model.add(layers.Dense(10, activation='softmax'))

# 4 编译模型
model.compile(optimizer='adam',   
              loss='categorical_crossentropy',   
              metrics=['accuracy'])

# 5 训练模型  
model.fit(x_train, y_train, epochs=5, batch_size=32, validation_split=0.2)

# 6 评估模型
# 在测试集上评估模型  
test_loss, test_accuracy = model.evaluate(x_test, y_test)  
print(f"\nTest Accuracy: {test_accuracy}")

# 7 进行预测
# 使用模型进行预测  
predictions = model.predict(x_test)  
predicted_classes = tf.argmax(predictions, axis=1)  # 获取预测类别

1.5 特性与优缺点

1.5.1 优点

        简单易用：适合新手和快速建立原型。
        直观性：层与层之间的关系一目了然。
        灵活性：支撑多种类型层的堆叠。

1.5.2 缺点

受限于简单结构：不适合复杂的多输入多输出结构或有共享层的模型。
扩展性不足：在面对复杂网络结构时可能需要通过函数式 API 或子类化模型实现。

1.6 小结

Keras 的序贯模型是构建神经网络的基本方法，特别适合初学者和简单任务。通过逐层添加、定义输入和输出，可以快速实现一个结构清晰的模型。随着经验的增长，可以尝试使用 Keras 的函数式 API 来构建更复杂的结构。

2. 函数式 API

Keras 的函数式 API提供了比序贯模型更灵活的方式来构建神经网络。使用函数式 API，用户可以轻松构建复杂的模型结构，包括多输入、多输出、共享层以及具有残差连接的深度学习模型。这使得它适用于几乎任何类型的模型设计需求。以下是对使用 Keras 函数式 API 的详细介绍。

2.1 函数式 API 的概念

函数式 API 允许用户通过定义输入层、各层参数及连接点来构建复杂模型。与序贯模型相比，函数式 API 提供了更加灵活的方式来创建模型，并且可以轻松地实现复杂的层连接。

2.2 如何使用函数式 API

使用函数式 API 的步骤包括：

        步骤1 导入所需的库。
        步骤2 定义输入层：使用 `keras.Input()` 方法。
        步骤3 构建网络的各层并连接：通过层的调用来创建不同层之间的连接。
步骤3 定义输出层。
步骤4 创建模型：使用 `keras.Model()`。
步骤5 编译模型：和序贯模型一样使用 `compile()` 方法。
步骤6 训练和评估模型。

2.3 示例：使用函数式API构建如下图所示的神经⽹络模型

# 导⼊⼯具包
import tensorflow as tf
# 定义模型的输⼊ 
inputs = tf.keras.Input(shape=(3,),name='imput')
# 第⼀层：激活函数为relu，其他默认 
x = tf.keras.layers.Dense(3,activation='relu',name='layer1')(inputs)
# 第⼆层：激活函数为relu，其他默认 
x = tf.keras.layers.Dense(2,activation='relu',name='layer2')(x)
# 第三层（输出层）：激活函数为sigmoid
outputs = tf.keras.layers.Dense(2,activation='sigmoid',name='layer3')(x)
# 使⽤Model来创建模型，指明输⼊和输出 
model = tf.keras.Model(inputs=inputs,outputs=outputs,name='my_model')

2.4 示例：使用函数式 API 构建多层神经网络

以下是通过 Keras 的函数式 API 构建一个适用于 MNIST 数字分类的神经网络示例。

# 1 导入必要的库
import tensorflow as tf  
from tensorflow import keras  
from tensorflow.keras import layers

# 2 加载和预处理数据
# 加载 MNIST 数据集  
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()  

# 数据预处理：展平和归一化  
x_train = x_train.reshape(-1, 28 * 28).astype('float32') / 255  
x_test = x_test.reshape(-1, 28 * 28).astype('float32') / 255  

# 将标签进行独热编码  
y_train = keras.utils.to_categorical(y_train, 10)  
y_test = keras.utils.to_categorical(y_test, 10)

#3 定义输入层
# 定义输入层  
inputs = keras.Input(shape=(28 * 28,))

# 4 构建网络的各层并连接
# 添加第一个隐藏层  
x = layers.Dense(128, activation='relu')(inputs)  

# 添加第二个隐藏层  
x = layers.Dense(64, activation='relu')(x)  

# 添加输出层  
outputs = layers.Dense(10, activation='softmax')(x)

# 5 创建模型
# 创建模型  
model = keras.Model(inputs=inputs, outputs=outputs)  

# 打印模型概况  
# model.summary()

# 6 编译模型
model.compile(optimizer='adam',   
              loss='categorical_crossentropy',   
              metrics=['accuracy'])

# 7 训练模型
model.fit(x_train, y_train, epochs=5, batch_size=32, validation_split=0.2)

# 8 评估模型
# 在测试集上评估模型  
test_loss, test_accuracy = model.evaluate(x_test, y_test)  
print(f"\nTest Accuracy: {test_accuracy}")

# 9 进行预测
# 使用模型进行预测  
predictions = model.predict(x_test)  
predicted_classes = tf.argmax(predictions, axis=1)  # 获取预测类别

2.5 函数式 API 的特性

2.5.1 优点

        灵活性：适用于复杂模型，如多输入多输出和层共享等。
        可拓展性：能够处理更复杂的模型架构，更易于实现深度学习中的常见结构（如残差网络，Inception 模型）。
        直观性：使用输入和输出对象清晰地表示模型的结构。

2.5.2 潜在缺点

复杂性：构建复杂模型可能需要更多的代码和理解。
学习曲线：初学者可能需要时间适应这种更灵活的构建方式。

2.6 小结

Keras 的函数式 API 提供了对模型定义的更大灵活性，允许用户在构建深度学习模型时以多种方式连接层。对于需要复杂结构的任务，函数式 API 是一个非常强大且便捷的选择。

3. 子类化方式

在 Keras 中，使用子类化方式来创建神经网络模型是一种灵活的方式，它允许开发者在构建模型时定义自己的操作逻辑。这种方法特别适合需要复杂控制流、共享层、或有特殊行为的模型。

3.1 子类化 `tf.keras.Model`

通过子类化 `tf.keras.Model`，用户可以创建自己的模型类。这种方法提供了最大的灵活性，能够实现多种定制化功能，比如定义前向传播方法、添加特定的层或操作以及实现自定义训练逻辑等。

3.2 创建子类化模型的步骤

以下是使用子类化方式创建自定义 Keras 模型的步骤：

步骤1 导入必要的库。
步骤2 定义一个新的类，继承自 `tf.keras.Model`。
步骤3 在类的构造函数中初始化所需的层。
步骤4 实现 `call` 方法，定义前向传播逻辑。
步骤5 创建模型实例。
步骤6 编译和训练模型。

3.3 示例：使用子类化 Keras Model构建如下图所示的神经⽹络模型

# 导⼊⼯具包
import tensorflow as tf
# 定义模型的输⼊
class MyModel(tf.keras.Model):
    def __init__(self):
        super(MyModel,self).__init__()
        # 第⼀层：激活函数为relu，其他默认 
        self.layer1 = tf.keras.layers.Dense(3,activation='relu',name='layers1',input_shape=(3,))
        # 第二层：激活函数为relu，其他默认 
        self.layer2 = tf.keras.layers.Dense(2,activation='relu',name='layers2')
        # 第三层（输出层）：激活函数为sigmoid，其他默认 
        self.layer3 = tf.keras.layers.Dense(2,activation='sigmoid',name='layers3')
    # 在call⽅法中万完成前向传播 
    def call(self,inputs):
        x = self.layer1(inputs)
        x= self.layer2(x)
        return self.layer3(x)

# 实例化模型
model = MyModel()

# 设置⼀个输⼊，调⽤模型（否则⽆法使⽤summay()）
x = tf.ones((1, 3)) 

y = model(x)

3.4 示例：子类化 Keras Model

下面是一个使用子类化方式构建简单神经网络的完整示例，适用于 MNIST 数字分类任务。

# 1 导入必要的库
import tensorflow as tf  
from tensorflow import keras  
from tensorflow.keras import layers

# .2 加载和预处理数据
# 加载 MNIST 数据集  
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()  

# 数据预处理：展平和归一化  
x_train = x_train.reshape(-1, 28 * 28).astype('float32') / 255  
x_test = x_test.reshape(-1, 28 * 28).astype('float32') / 255  

# 将标签进行独热编码  
y_train = keras.utils.to_categorical(y_train, 10)  
y_test = keras.utils.to_categorical(y_test, 10)

# 3 定义子类化模型
class MyModel(tf.keras.Model):  
    def __init__(self):  
        super(MyModel, self).__init__()  
        self.dense1 = layers.Dense(128, activation='relu')  # 第一个隐藏层  
        self.dense2 = layers.Dense(64, activation='relu')   # 第二个隐藏层  
        self.output_layer = layers.Dense(10, activation='softmax')  # 输出层  

    def call(self, inputs):  
        x = self.dense1(inputs)  
        x = self.dense2(x)  
        return self.output_layer(x)

# 4 创建模型实例
model = MyModel()

# 5 编译模型
model.compile(optimizer='adam',  
              loss='categorical_crossentropy',  
              metrics=['accuracy'])

# 6 训练模型
model.fit(x_train, y_train, epochs=5, batch_size=32, validation_split=0.2)

# 7 评估模型
test_loss, test_accuracy = model.evaluate(x_test, y_test)  
print(f"Test Accuracy: {test_accuracy}")

# 8 进行预测
predictions = model.predict(x_test)  
predicted_classes = tf.argmax(predictions, axis=1)  # 获取预测的类别