TensorFlow基础、模型训练与卷积神经网络
1. TensorFlow基础操作
在大型项目中,为变量命名有助于代码的清晰性和调试。若要修改变量的值,可使用 Variable.assign 方法,示例如下:
a.assign(a + 1)
print(a.numpy()) # 输出 4
若不使用 .assign() 方法,将会创建一个新的张量方法:
b = a + 1
print(b) # 输出 <tf.Tensor: id=21231, shape=(), dtype=int32, numpy=4>
最后,删除Python对变量的引用会将对象从活动内存中移除,为创建其他变量释放空间。
2. 分布式策略
在处理大型模型和数据集时,需要更多的计算能力,通常意味着要使用多台服务器。 tf.distribute.Strategy API 定义了多台机器如何协同训练模型,常见的策略如下:
| 策略名称 | 描述 |
| ---- | ---- |
| MirroredStrategy | 用于在单台机器的多个GPU上进行训练,各设备间的模型权重保持同步 |
| MultiWorkerMirroredStrategy | 类似于 MirroredStrategy,但用于多台机器的训练 |
| Pa
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



