使用Keras/Tensorflow.keras子类API构建复杂模型

i吃咸鱼的猫

已于 2022-06-23 21:39:45 修改

阅读量571

点赞数

文章标签： python tensorflow 深度学习神经网络

于 2022-06-23 21:37:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_38380853/article/details/125435058

版权

本文详细介绍了如何使用Keras的Model API构建四种不同类型的深度学习模型：简单顺序模型、短路径顺序模型、多输入顺序模型和多输入多输出模型。每个模型的构建过程和训练步骤都进行了清晰的展示，包括输入层、隐藏层和输出层的定义，以及模型的编译和评估。这些模型涵盖了基本的神经网络结构和进阶的模型设计技巧。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文主要介绍了几种使用keras.Model API构建深度网络模型的基本方法。

1. 简单顺序模型

模型由输入层、隐藏层、和输出层顺序连接构成（如图1所示）

图1. 简单顺序模型示意图

(1) 定义模型结构

def build_model(X_train):

input_layer = keras.layers.Input(shape=X_train.shape[1:])

hidden1_layer = keras.layers.Dense(30, activation=‘ReLU’)(input_layer)

hidden2_layer = keras.layers.Dense(30, activation=‘linear’)(hidden1_layer)

output_layer = keras.layers.Dense(1)(hidden2_layer)

model = keras.Model(inputs=input_layer, outputs=output_layer)

return model

(2) 建模训练

model = build_model(X_train)

model.compile(loss=‘mse’, optimizer=keras.optimizers.SGD(lr=1e-3))

model.fit(X_train, Y_train)

eval = model.evaluate(X_val, Y_val)

Y_pred = model.pred(X_test)

2. 短路径顺序模型

模型由输入层、隐藏层、输出层和短路径连接构成（如图2所示）

图2. 短路径顺序模型示意图

(1) 定义模型结构（注意红色字体部分）

def build_model(X_train):

input_layer = keras.layers.Input(shape=X_train.shape[1:])

hidden1_layer = keras.layers.Dense(30, activation=‘ReLU’)(input_layer)

hidden2_layer = keras.layers.Dense(30, activation=‘linear’)(hidden1_layer)

concat_layer = keras.layers.Concatenate()([input_layer, hidden2_layer])

output_layer = keras.layers.Dense(1)(concat_layer)

model = keras.Model(inputs=input_layer, outputs=output_layer)

return model

(2) 建模训练

model = build_model(X_train)

model.compile(loss=‘mse’, optimizer=keras.optimizers.SGD(lr=1e-3))

model.fit(X_train, Y_train)

eval = model.evaluate(X_val, Y_val)

Y_pred = model.pred(X_test)

3. 多输入顺序模型

模型由两个及以上输入层、隐藏层、输出层和短路径连接构成（如图3所示）

图3. 多输入顺序模型示意图

(1) 定义模型结构（注意红色字体部分）

def build_model(X_train1, X_train2):

input1_layer = keras.layers.Input(shape=X_train1.shape[1:])

input2_layer = keras.layers.Input(shape=X_train2.shape[1:])

hidden1_layer = keras.layers.Dense(30, activation=‘ReLU’)(input1_layer)

hidden2_layer = keras.layers.Dense(30, activation=‘linear’)(hidden1_layer)

concat_layer = keras.layers.Concatenate()([input2_layer, hidden2_layer])

output_layer = keras.layers.Dense(1)(concat_layer)

model = keras.Model(inputs=[input1_layer, input2_layer], outputs=output_layer)

return model

(2) 建模训练（注意红色字体部分）

model = build_model(X_train1, X_train2)

model.compile(loss=‘mse’, optimizer=keras.optimizers.SGD(lr=1e-3))

history = model.fit((X_train1, X_train2), Y_train)

eval = model.evaluate((X_val1, X_val2), Y_val)

Y_pred = model.pred((X_test1, X_test2))

4. 多输入多输出模型

模型由两个及以上输入层、隐藏层、两个及以上输出层连接构成（如图4所示）

图4. 多输入多输出模型示意图

(1) 定义模型结构（注意红色字体部分）

def build_model(X_train1, X_train2):

input1_layer = keras.layers.Input(shape=X_train1.shape[1:])

input2_layer = keras.layers.Input(shape=X_train2.shape[1:])

hidden1_layer = keras.layers.Dense(30, activation=‘ReLU’)(input1_layer)

hidden2_layer = keras.layers.Dense(30, activation=‘linear’)(hidden1_layer)

concat_layer = keras.layers.Concatenate()([input2_layer, hidden2_layer])

output1_layer = keras.layers.Dense(1, name=‘main_output’)(concat_layer)

ouput2_layer = keras.layers.Dense(1, name=‘aux_output)(hidden2_layer)

model = keras.Model(inputs=[input1_layer, input2_layer], outputs=[output1_layer, output2_layer])

return model

(2) 建模训练（注意红色字体部分）

model = build_model(X_train1, X_train2)

model.compile(loss=[‘mse’, ‘mse’], loss_weight=[0.9, 0.1], optimizer=keras.optimizers.SGD(lr=1e-3))

history = model.fit((X_train1, X_train2), (Y_train1, Y_train2))

eval = model.evaluate((X_val1, X_val2), (Y_val1, Y_val2))

Y_pred1, Y_pred2 = model.pred((X_test1, X_test2))

参考文献：

[1] A GéRon. Hands-on machine learning with Scikit-Learn and TensorFlow : concepts, tools, and techniques to build intelligent systems. 2017.

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。