Keras大法(3)——使用Keras的一般流程

本文详细介绍Keras库的使用流程,包括导入库、定义模型、编译、训练、评估及保存模型。适合初学者快速上手。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

https://blog.youkuaiyun.com/weixin_42499236/article/details/84623142

Keras大法(3)——使用Keras的一般流程


在这里插入图片描述

 

(一)基本流程

使用Keras的基本流程可以归纳如下:

导入Keras

定义模型

编译模型

训练模型

评估模型

保存模型

以下我们对上述流程依次进行讲解。

(二)流程示例

(1)导入Keras库

from tensorflow import keras
  • 1

(2)定义模型

在定义模型时我们有两种选择,一是使用keras.models.Sequential()方法定义次序模型,这种方法定义的模型将会从头到尾依次执行,二是使用函数式API定义更加灵活的高级模型,在这一节里我们只介绍次序模型:

# 实例化一个次序模型
model = keras.models.Sequential()
# 使用model.add方法添加隐层
model.add(···)
model.add(···)
  • 1
  • 2
  • 3
  • 4
  • 5

具体如何定义一个隐层,我们会在下节讲到

(3)编译模型

在我们定义完模型后,需要使用complie方法对其进行编译:

model.compile(loss = keras.losses.mean_squared_error,
              optimizer= keras.optimizers.Adam(0.01),
              metrics= ['accuracy'])
  • 1
  • 2
  • 3

在编译操作中,我们需要定义模型使用的优化方法,损失函数,评估模型的指标等

(4)训练模型

我们使用model.fit()方法来训练模型,将训练数据的特征和标签导入:

model.fit(x_train, y_train, batch_size= 10, epochs = 5)
  • 1

在这里可以指定批处理数、训练的世代数等参数

(5)评估模型

使用model.evaluate()方法来评估模型,如下所示:

model.evaluate(x=None, y=None, batch_size=None, verbose=1, sample_weight=None, steps=None)
  • 1

同样可以指定批处理数等参数

(6)保存模型

模型训练完成之后,我们使用model.save()方法来保存模型

model.save(/model.h5)
  • 1

最终模型会被保存为h5格式的文件

(三)总 结

在这一节中我们对Keras的基本使用流程做了介绍,有任何的问题请在评论区留言,我会尽快回复,谢谢支持!

### 计算Keras深度学习模型中的参数数量 在构建并编译好一个Keras模型后,可以通过内置函数`model.count_params()`来获取整个模型的总参数量[^2]。此方法会自动遍历每一层,并累加各层内部的所有权重矩阵和平移向量所含有的元素数目。 对于更深入的理解以及手动确认这些数值是否合理,则需理解具体结构下的计算逻辑: #### 卷积层 卷积核尺寸乘以输入特征图的数量再加上偏置项构成一层内的全部连接权值;如果存在多组滤波器则还需将其个数纳入考量范围之内。例如,在二维空间下拥有\(C_{in}\)个通道作为输入、应用了大小为\(k×k\)窗口且配置有\(C_{out}\)种不同类型的过滤器时,该操作引入的新变量总数等于\((k × k × C_{in} + 1) × C_{out}\)[^1]。 #### 全连接层/密集层(Dense Layer) 当涉及到全连接组件时,假设某一层接收到来自前序节点传递过来的数据维度是\(n\)维列向量形式表示的一个实例样本特性集合,而本阶段计划映射至另一m维表达空间内,则二者间建立起一对一关联关系所需的独立系数即为两者形状相乘的结果加上额外增加的一系列截距因子——也就是所谓的bias terms。因此这里涉及到了\(n \times m+m=n\times(m+1)\)个待估测位置上的超参设定工作。 下面给出一段Python代码用于展示如何创建简单网络架构并通过上述两种方式分别求解其理论估计值与实际统计所得结果之间的对比情况: ```python from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Conv2D, Flatten # 构建简单的CNN模型 model = Sequential([ Conv2D(32, kernel_size=(3, 3), input_shape=(64, 64, 3)), Flatten(), Dense(10), ]) print("Model parameters count by model API:", model.count_params()) def manual_param_count(model): params_sum = 0 for layer in model.layers: weights = layer.get_weights() if isinstance(layer,Conv2D): # 对于convolutional layers w,b=weights[0],weights[-1] param_per_filter=w.size+len(b.flatten()) num_filters=b.shape[0] params_sum+=param_per_filter*num_filters elif isinstance(layer,Dense): # dense layers case handling w,b=weights[0],weights[-1] params_sum +=w.size+b.size return params_sum manual_total = manual_param_count(model) print("Manually calculated total parameters:", manual_total ) ``` 通过这段脚本可以直观看到利用API接口快速查询到的整体规模概况同基于逐层解析法得出的手动核算版本之间是否存在差异之处。通常情况下二者应当保持一致除非某些特殊情形影响到了默认行为模式之外的操作流程设计思路。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值