tensorflow设置显存自适应和显存比例.

最新推荐文章于 2024-08-18 00:00:00 发布

转载最新推荐文章于 2024-08-18 00:00:00 发布 · 1.5k 阅读

深度学习专栏收录该内容

9 篇文章

订阅专栏

本文介绍了如何在使用TensorFlow时避免GPU显存满载的问题，提供了两种配置方法：一是设置GPU内存分配比例；二是启用按需增长模式，类似于Theano的行为。

部署运行你感兴趣的模型镜像

转自:http://blog.youkuaiyun.com/cq361106306/article/details/52950081

用惯了theano.再用tensoflow发现一运行显存就满载了，吓得我吃了一个苹果。
用天朝搜索引擎毛都搜不到，于是翻墙找了下问题的解决方法，原来有两种
1. 按比例

config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.4
session = tf.Session(config=config, ...)
   1
2
3
   1
2
3

按需求增长(theano那种)

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
session = tf.Session(config=config, ...)
   1
2
3
   1
2
3

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。它提供了一个灵活的平台,用于构建和训练各种机器学习模型

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

threadroc

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

TensorFlow深度学习设置显存占用率

half_lemon_c的博客

11-21

2373

在使用TensorFlow深度学习的时候，会默认占用最大显存，如何设置显存占用率，总结如下：I. 两种方法查看显存使用情况II. 设置TensorFlow显存占用率III. 代码插入位置IV. 使用对比V. 参考资料 I. 两种方法查看显存使用情况方法1：CMD窗口中输入命令nvidia-smi 方法2：使用软件AIDA64（推荐），实时监测电脑硬件使用情况电脑闲置可用显存为7443 MB。 II. 设置TensorFlow显存占用率 1. 按需动态分配显存（更灵活） config = t

allow_growth控制tensorflow显存动态增长无效问题

豆芽菜

09-10

2880

问题：tensorflow1.15环境使用config.gpu_options.allow_growth = True，控制显存动态增长，发现无效，显存仍然会被完全占用 config = tf.ConfigProto() config.gpu_options.allow_growth = True tf.keras.backend.set_session(tf.Session(config=config)) 分析：暂未找到原因，类似问题：gpu_options doesn't work · Issue

参与评论您还未登录，请先登录后发表或查看评论

tensorflow-gpu设置显存占用情况（Memory-Usage）

m0_55621747的博客

10-26

800

每次在服务器跑深度学习代码，我的数据量很小。但是内存直接占满。如下图可以设置内存占用情况。

tensorflowGPU显存占用

不正经的码狗

07-17

617

【Tensorflow】设置显存自适应，显存比例

weixin_34080951的博客

01-17

225

用惯了theano.再用tensoflow发现一运行显存就满载了，吓得我吃了一个苹果。用天朝搜索引擎毛都搜不到，于是FQ找了下问题的解决方法，原来有两种按比例 config = tf.ConfigProto() config.gpu_options.per_process_gpu_memory_fraction = 0.4 session = tf.Session(config=c...

Tensorflow设置显存自适应,显存比例的操作

09-18

以上就是关于 TensorFlow 中显存自适应和显存比例设置的详细说明。通过灵活地调整这些参数，我们可以更有效地利用 GPU 资源，同时避免因为显存不足而引发的问题。在实践中，建议根据模型的规模和计算需求进行调整，...

Tensorflow与Keras自适应使用显存方式

09-16

总结来说，无论是Tensorflow还是Keras，都可以通过设置环境变量、配置GPUOptions或修改后端Session来实现显存的自适应分配，从而更高效地利用GPU资源。在实际应用中，应根据模型的大小和计算需求灵活调整这些设置，...

Tensorflow设置显存自适应，显存比例

tsq292978891的博客

12-07

4563

Tensorfow框架下，在模型运行时，设置对显存的占用。 1. 按比例 config = tf.ConfigProto() config.gpu_options.per_process_gpu_memory_fraction = 0.4 # 根据自己的需求确定 session = tf.Session(config=config, ...) 2. 自适应 config

tensorflow2 设置显存按需增长

秋叶原的黑猫的博客

04-01

2030

关于tensorflow2如何使用GPU，网上有很多方法，包括但不限于：方法一：指定某块GPU import os os.environ["CUDA_VISIBLE_DEVICES"] = "0" 实际使用中我只能指定CUDA_VISIBLE_DEVICES的参数为“2”，指定其他参数报错。但即便如此，跑代码的时候还是没有用到GPU。方法二：使用configproto()方法，控制GPU显存使用比例 import tensorflow as tf from keras.backend.tensorfl

TensorFlow学习- GPU显存占满而利用率（util）很低原因&提高方法

m0_38064529的博客

11-20

2万+

2080的显卡，跑YOLOv3，显存已经满了，显卡利用率却只有7% 百度了一圈，看到几篇比较靠谱的博客，直接贴链接参考1 TensorFlow如何提高GPU训练效率和利用率 ...

Tensorflow2.0对不平衡数据的分类（含混淆矩阵与ROC图）

12-22

文章目录数据集介绍代码实现1、导入需要的库2、导入数据集查看数据集中正样本（欺诈）和负样本（未欺诈）的数量对数据集进行稍微处理3、划分数据集划分训练集、验证集和测试集划分出特征和标签4、标准化处理5、查看正负样本的相关信息区分正负样本在’V5’，’V6’两个维度上比较正负样本6、构建模型7、对比：有bias_initializer vs 没有bias_initializer没有bias_initializer构建模型用模型预测前十个样本将训练集输入模型来评价模型有bias_initializer计算bias_initializer构建模型用模型预测前十个样本将训练集输入模型来评价模型8、保存初

python sklearn库 rnn_如何使用Tensorflow计算RNN和LSTM模型的AUC并生成ROC曲线？

weixin_29025501的博客

01-14

1498

我使用一个自定义的预定义函数trainDNN运行RNN和LSTM模型import tensorflow as tffrom tensorflow.contrib.layers import fully_connectedimport h5pyimport timefrom sklearn.utils import shuffledef trainDNN(path, n_days, n_featur...

分类器的评价指标（ROC、AUC）原理并利用Python+tensorflow举例

爱吃猫的小鱼干

10-25

4134

本文介绍分类器的主要性能指标，介绍ROC和AUC的原理，并以在Tensorflow中利用MNIST数据集训练的手写数字识别模型为例，做出其ROC曲线。 1.基本概念针对一个二分类问题，将实例分成正类(postive)或者负类(negative)。但是实际中分类时，会出现四种情况.，如下表所示：即：若一个实例是正类，并且被预测为正类，即为真正（阳）类(True Postive TP...

Tensorflow2.0之绘图：分类问题的准确率、精确率、召回率、ROC曲线以及曲线下面积

cocofisher的博客

03-10

1万+

文章目录准确率、精确率、召回率、ROC曲线的定义用Tensorflow2.0绘制相关曲线建模时设置METRICS定义损失曲线、AUC曲线、精确率曲线以及召回率曲线函数定义ROC曲线函数预测训练集和测试集ROC曲线定义混淆矩阵函数绘制混淆矩阵准确率、精确率、召回率、ROC曲线的定义阳性与阴性准确率精确率与召回率 ROC 和曲线下面积用Tensorflow2.0绘制相关曲线建模时设置MET...

TensorFlow深度学习框架扩展知识详解

qq_27815483的博客

08-18

1718

TensorFlow 是一种采用数据流图（data flow graphs），用于数值计算的开源软件库。其中Tensor代表传递的数据为张量（多维数组），Flow代表使用计算图进行运算。数据流图用「节点」（nodes）和「边」（edges）组成的有向图来描述数学运算。nodes一般用来表示施加的数学操作，但也可以表示数据输入的起点和输出的终点，或者是读取 / 写入持久变量（persistent variable）的终点。edges表示节点之间的输入 / 输出关系。

TensorFlow限制占用显存比例以及实现占用显存自增长

想写就写咯

04-26

3344

当实验室的服务器紧张，一张卡要几个人用时，就得预留显存给别人了，如果默认模式，TensorFlow会占用所有的freememory，这就不友好了。除此之外，如果指定显存自增长，也方便你知道自己的程序需要多大的显存。 tf_config = tf.ConfigProto() tf_config.gpu_options.per_process_gpu_memory_fraction = 0.5 #...

用tensorflow画ROC曲线

mao_feng的博客

01-25

1万+

1. 先准备好你的数据文件，csv格式，该文件共3列，第一列是数据id，第2列是预测分数（0到1），第3列是数据的label（0或1） 2. 运行下面的python程序：python tf_roc.py /tmp/predict_label.csv 200 /tmp/tb_roc 3. 其中第2个参数200表示画ROC曲线的精度，越大，曲线越精细。 4. 启动tensorboard： ten

tensorflow显存不够使用如何解决（windows系统）

热门推荐

zhuimengshaonian66的博客

07-31

2万+

本人在跑完训练部分，然后开始跑测试部分出现了以下问题，这个问题困扰了一上午查看下显卡发现果然几乎用完了，具体查看步骤请参考：https://blog.csdn.net/zhuimengshaonian66/article/details/81286206 其实之前也出现过一次这种问题，忘记怎么解决了，好像是重启，不建议大家去试，因为下面有完美解决这个问题的办法我是在 main...

using System; using System.IO; using System.Threading; using Tensorflow; //引入TensorFlow.NET核心命名空间（如 tf 对象）。 using Tensorflow.Keras; using Tensorflow.Keras.ArgsDefinition; using Tensorflow.Keras.Engine; using Tensorflow.Keras.Layers; using Tensorflow.NumPy;//引入NumPy兼容的数组操作（如 np.array ）。 using static Tensorflow.Binding;//静态导入TensorFlow和Keras的API，避免重复写类名（如直接使用 tf 和 keras ）。 using static Tensorflow.KerasApi;//应用模型层搭建 #region 安装包版本号 //numsharp 0.30.0 //TensorFlow.NET 0.150.0 //SciSharp.TensorFlow.Redist 2.16.0 //TensorFlow.Keras 0.15.0 #endregion #region //安装包对应表 //TensorFlow.Keras TensorFlow.NET SciSharp.TensorFlow.Redist // 2.10.x 0.13.0 2.10.0 // 2.11.x 0.14.0 2.11.0 // 0.15.0 0.15.0+ 2.12.0+ #endregion #region // 运行结果说明，loss（均方误差）：逐渐下降，越低越好。说明模型对训练数据的拟合效果显著提升。 // mean_absolute_error（平均绝对误差）：预测值与真实值的平均绝对偏差逐渐下降，越低越好。模型预测精度提高。 // 验证集指标（val_loss/val_mean_absolute_error）：逐渐下降，越低越好。说明模型在未见过的数据上也能保持较好的泛化能力，未出现明显过拟合。 // Keras模型Functional API方式搭建线性回归 #endregion namespace Keras.NET_Prediction_main_program { class Program { static void Main() { #region GPU显卡K80设置 Environment.SetEnvironmentVariable("CUDA_VISIBLE_DEVICES", "1"); //指定K80双12GPU 1号显卡，多张显卡时可用“，”隔开，如"0,1"（序号0对应1号显卡） var gpus = tf.config.list_physical_devices("GPU"); // 获取系统中所有物理GPU设备列表（TensorFlow API） // 判断是否满足双K80显卡条件： // 1. gpus.Length >= 2：检测到至少2个GPU设备 // 2. gpus.All(...): 所有检测到的GPU设备名称包含"K80"（确保是K80型号） bool hasDualK80 = gpus.Length >= 2 && gpus.All(gpu => gpu.DeviceName.Contains("K80")); int gpuCount = gpus.Length; // 记录检测到的GPU总数量（可能是1或多个） if (gpus.Length > 0) // 检查是否有可用的GPU设备 { Console.WriteLine("CUDA 可用，检测到以下 GPU 设备："); // 输出提示信息：CUDA可用，并列出检测到的GPU设备 foreach (var gpu in gpus) // 遍历每个检测到的GPU设备 { Console.WriteLine(gpu.DeviceName); // 输出当前GPU的设备名称（例如："Tesla K80"） tf.config.experimental.set_memory_growth(gpu, true); // 启用当前GPU的显存动态分配，避免TensorFlow一次性占满所有显存，按需分配内存。参数true表示允许显存动态增长（适合多卡/多任务场景） //Console.WriteLine($"设备 {gpu.DeviceName} 已启用动态显存分配"); } if (hasDualK80) // 如果满足双K80条件（hasDualK80为true） { Console.WriteLine($"检测到 {gpuCount} 个 K80 显卡，启用双卡显存优化"); // 输出提示信息：告知用户检测到双K80显卡并启用优化 } } else { Console.WriteLine("CUDA 不可用，仅使用 CPU 进行计算。"); // 无GPU设备时的提示信息：使用CPU计算 } #endregion string csvPath = @"D:\编程软件系列\VS2022社区版\文件\Functional DNNmodel\数据\SuperbigNumberBB.csv"; // 获取CSV文件路径 var (X, Y) = CSVDataLoader.LoadCSVData(csvPath); // 调用CSVDataLoader类LoadCSVData方法，从CSV文件中加载特征数据 X 和标签数据 Y var (train_X, train_Y, val_X, val_Y, test_X, test_Y) = StratifiedSampler.StratifiedSplit(X, Y, 0.6f, 0.2f); // 调用StratifiedSampler类StratifiedSplit方法，分层抽样划分数据集，按6:2:2比例划分训练集、验证集、测试集 StratifiedSampler.ValidateStratifiedSplit(Y, train_Y, val_Y, test_Y); // 调用StratifiedSampler类ValidateStratifiedSplit方法，验证分层抽样法，正式运行时注释掉 # region //验证集和测试集必须使用训练集计算的均值/标准差标准化，避免数据泄露。 //验证集的作用：训练过程中通过验证集监控过拟合（如验证损失上升、准确率停滞），早停回调可提前终止无效训练。 //测试集的独立性：测试集仅用于最终评估，不参与模型调参，确保结果真实反映模型泛化能力。 //正则化增强：通过L2正则化（ CustomL2Regularizer ）和Dropout层抑制过拟合，提升模型泛化性。 // 1. 数据预处理（示例：标准化，训练集计算参数，验证/测试集复用） Tensor trainXTensor = tf.constant(train_X); // 将NumPy数组train_X转换为TensorFlow张量 Tensor trainXMeanTensor = math_ops.reduce_mean(trainXTensor, axis: 0); // 按列计算均值（axis=0表示按列计算，axis=1表示按行计算） NDArray trainXMean = trainXMeanTensor.numpy(); // 将均值张量转换为numpy数组 Tensor trainXStdTensor = math_ops.reduce_std(trainXTensor, axis: 0); // 按列计算标准差 NDArray trainXStd = trainXStdTensor.numpy(); // 将标准差张量转换为numpy数组 NDArray train_X_normalized = (train_X - trainXMean) / (trainXStd + 1e-8f); // 对训练集进行Z-score标准化：(x - 均值)/标准差，1e-8f防止除以0的情况 NDArray val_X_normalized = (val_X - trainXMean) / (trainXStd + 1e-8f); // 对验证集使用训练集的均值和标准差进行标准化，确保验证集和训练集使用相同的标准化参数 NDArray test_X_normalized = (test_X - trainXMean) / (trainXStd + 1e-8f); // 对测试集使用训练集的均值和标准差进行标准化，确保测试集和训练集使用相同的标准化参数 int singleGpuBatchSize = 512; // K80 单卡最大批次（建议单卡 96 → 双卡 192） int k80BatchSize = hasDualK80 ? singleGpuBatchSize * gpuCount : singleGpuBatchSize; // 双K80显卡总批次大小，单卡*卡的数量 // 2. 构建tf.data数据集（支持批量、打乱、预加载） var trainDataset = tf.data.Dataset.from_tensor_slices(train_X_normalized, train_Y) //构建tf.data数据集（训练集） .shuffle(buffer_size: (int)train_X_normalized.shape[0]) // 训练集打乱 .batch(batch_size: k80BatchSize) // 批量大小 .cache() // 将数据缓存到内存，减少数据加载时间 .prefetch(buffer_size: tf.data.AUTOTUNE); // 预加载优化 var valDataset = tf.data.Dataset.from_tensor_slices(val_X_normalized, val_Y) //构建tf.data数据集（验证集） .batch(batch_size: k80BatchSize) // 批量大小,验证集不打乱 .cache() // 将数据缓存到内存，减少数据加载时间 .prefetch(tf.data.AUTOTUNE); // 预加载优化 var testDataset = tf.data.Dataset.from_tensor_slices(test_X_normalized, test_Y) //构建tf.data数据集（测试集） .batch(batch_size: k80BatchSize); // 批量大小,测试集不打乱 // 步骤2：使用Functional API方式构建模型 // 1. 配置 Dense 层参数（根据对象浏览器中 DenseArgs 的属性） var denseArgs1 = new DenseArgs { Units = 256, // 神经元数量 Activation = tf.keras.activations.Relu, // Relu激活函数 KernelRegularizer = new CustomL2Regularizer(0.06f) // 自定义正则化类 }; var denseArgs2 = new DenseArgs { Units = 256, // 神经元数量 Activation = tf.keras.activations.Relu, // Relu激活函数 KernelRegularizer = new CustomL2Regularizer(0.1f) // 自定义正则化类 }; var denseArgs3 = new DenseArgs { Units = 256, // 神经元数量 Activation = tf.keras.activations.Relu, // Relu激活函数 KernelRegularizer = new CustomL2Regularizer(0.1f) // 自定义正则化类 }; var denseArgs4 = new DenseArgs { Units = 128, // 神经元数量 Activation = tf.keras.activations.Relu, // Relu激活函数 KernelRegularizer = new CustomL2Regularizer(0.1f) // 自定义正则化类 }; // 2. 实例化 Dense 层（根据对象浏览器中 Dense 的构造函数） Dense denseLayer1 = new(denseArgs1); Dense denseLayer2 = new(denseArgs2); Dense denseLayer3 = new(denseArgs3); Dense denseLayer4 = new(denseArgs4); #endregion // 步骤2：使用Functional API方式构建模型 var inputs = keras.Input(shape: 4); //输入层，shape 特征列数。 var x = denseLayer1.Apply(inputs); //应用自定义的 Dense 层，传入输入层 inputs，返回一个新的张量x。这里使用了之前配置的 DenseArgs 参数，包含输出维度、激活函数和正则化器等信息。 x = keras.layers.Dropout(rate: 0.5f).Apply(x); //Dropout率系数 x = denseLayer2.Apply(x); x = keras.layers.Dropout(rate: 0.2f).Apply(x); x = denseLayer3.Apply(x); x = keras.layers.Dropout(rate: 0.3f).Apply(x); x = denseLayer4.Apply(x); x = keras.layers.Dropout(rate: 0.4f).Apply(x); var outputs = keras.layers.Dense(5, activation: "softmax").Apply(x); //输出层，回归任务神经元数量为1；分类任务神经元数量等于类别数，配合Softmax激活函数。 var model = keras.Model(inputs, outputs); //使用 keras.Model方法将输入层 inputs 和输出层 outputs 组合成一个完整的神经网络模型 model.summary(); //调用 summary 方法打印模型的结构摘要，包括每一层的名称、输出形状和参数数量等信息，方便了解模型的基本情况。 // 步骤3：编译模型； //损失函数，SparseCategoricalCrossentropy多分类损失函数（不需要One-Hot预处理）。 //优化器，Adam ，学习率为自适应 。 //评估表，accuracy 表示准确率。警告：准确率通常用于分类任务，线性回归任务中使用均方误差。 model.compile(loss: keras.losses.SparseCategoricalCrossentropy(), optimizer: keras.optimizers.AdamW(learning_rate: 0.001f), metrics: ["accuracy"]); // 步骤4：训练模型 //train_X 对应训练集特征， train_Y 对应训练集标签，batch_siz批次大小，epochs 训练轮数（迭代次数）， //验证集数据可采用两种方式：1.validation_split : 0.2f将训练集划分出一定比例作为验证集。2.validation_data: (test_X, test_Y)指定已划分好的验证集进行验证。 model.fit(trainDataset, epochs: 10, validation_data: valDataset, verbose: 0); Console.WriteLine(); //换行 Console.Out.Flush(); // 强制刷新输出缓冲区，避免输出数据重叠 // 步骤5：评估模型 var testResult = model.evaluate(test_X_normalized, test_Y, //输入测试集数据，test_X对应特征, test_Y对应标签 verbose: 0); //详细度，0为最简模式，1为简单显示进度信息 // 从字典中提取测试集损失和准确率（Tensor 类型需通过 .numpy() 转换为数值） double testLoss = (double)testResult["loss"]; // 通过键名 "loss" 获取损失值 double testAcc = (double)testResult["accuracy"]; // 通过键名 "accuracy" 获取准确率 // 步骤6：保存模型 model.save(filepath: "D:\\SavedModel\\SuperbignumberBB.model.tf", //模型保存路径（全英文且不能有空格，否则不能载入） overwrite: true, //true，自动覆盖原有文件 include_optimizer: true, //true，将优化器信息保存一起 save_format: "tf"); //保存文件类型，"h5"模型为旧版本模型，目前不采用。 var weights = model.TrainableVariables; //获取训练参数，model.TrainableVariables 获取模型中所有可训练的变量，对于这个简单的线性回归模型，可训练变量包括权重和偏置。 print($"测试集损失test_Loss: {testLoss:F4}, 测试集准确率test_Acc: {testAcc:P2}"); //打印测试集指标 print($"权重weight: {weights[0].numpy()}");//打印训练后模型的权重和偏置。 weights[0] 对应权重， weights[1] 对应偏置，numpy() 方法将 TensorFlow 的张量转换为 NumPy 数组以便于打印输出。 print($"偏置bias: {weights[1].numpy()}"); } } }System.EntryPointNotFoundException HResult=0x80131523 Message=Unable to find an entry point named 'TF_GetHandleShapeAndType' in DLL 'tensorflow'. Source=Tensorflow.Binding StackTrace: 在 Tensorflow.c_api.TF_GetHandleShapeAndType(SafeGraphHandle c_graph, TF_Output output) 在 Tensorflow.ops.get_resource_handle_data(Tensor graph_op) 在 Tensorflow.Operations.handle_data_util.get_resource_handle_data(Tensor graph_op) 在 Tensorflow.Eager.backprop_util._DTypeFromTensor(Tensor tensor) 在 Tensorflow.Eager.backprop_util.IsTrainable(Tensor tensor) 在 Tensorflow.Functions.TapeGradientFunctions.<>c.<.ctor>b__16_0(Tensor t) 在 System.Linq.Enumerable.WhereEnumerableIterator`1.GetCount(Boolean onlyIfCheap) 在 Tensorflow.Functions.TapeGradientFunctions..ctor(FuncGraph func_graph, Boolean need_gradients_for_jvps) 在 Tensorflow.Functions.DelayedRewriteGradientFunctions..ctor(FuncGraph func_graph, Dictionary`2 attrs) 在 Tensorflow.Functions.ConcreteFunction._set_infer_function() 在 Tensorflow.Functions.ConcreteFunction..ctor(Func`2 func, TF_DataType dtype) 在 Tensorflow.FlatMapDataset..ctor(IDatasetV2 input_dataset, Func`2 map_func) 在 Tensorflow.DatasetV2.flat_map(Func`2 map_func) 在 Tensorflow.Keras.Engine.DataAdapters.TensorLikeDataAdapter..ctor(DataAdapterArgs args) 在 Tensorflow.Keras.Engine.DataAdapters.DataHandler..ctor(DataHandlerArgs args) 在 Tensorflow.Keras.Engine.Model.evaluate(NDArray x, NDArray y, Int32 batch_size, Int32 verbose, NDArray sample_weight, Int32 steps, Int32 max_queue_size, Int32 workers, Boolean use_multiprocessing, Boolean return_dict, Boolean is_val) 在 Keras.NET_Prediction_main_program.Program.Main() 在 D:\编程软件系列\VS2022社区版\文件\Keras.NET Prediction main program\Program.cs 中: 第 165 行

最新发布

11-26