
报错
*pprp*
GiantPandaCV公众号作者,研究方向automl,nas
展开
-
loss.backward() Segmentation fault 段错误
在运行一个非常简单的深度学习程序的时候,发现运行一段时间会报错 段错误经过定位发现是执行loss.backward()的时候出现的问题,而源码明显是没有什么问题的。具体排查可以这样:gdb --args python train.py 然后发现这个问题是存在pytorch内部的,而不是自己写的逻辑有问题。注:这个torch版本是1.8.0, 执行其他程序没有明显报错。更新到1.10.0版本就可以解决segmentation fault的问题。...原创 2021-11-20 09:45:39 · 1863 阅读 · 0 评论 -
libpng warning iCCP 错误处理方法
png图片缺乏某些库,导致损坏,或者多余了一些数据会导致以下报错:libpng warning: iCCP: known incorrect sRGB profilelibpng warning iccp extra compressed data一些可能的解决方案:已有方案来自:https://blog.youkuaiyun.com/qq_37924224/article/details/119181028libpng 1.6及以上版本增强了ICC profiles检查,所以发出警告。从 PNG 图像原创 2021-10-30 19:18:55 · 5320 阅读 · 0 评论 -
RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)`
处理方法:检查class num和prediction维度是否一致。减少batch size原创 2021-06-20 15:29:09 · 371 阅读 · 0 评论 -
call() missing 1 required positional argument xxx
环境:tf2.1报错:call() missing 4 required positional argument x y w h修改:@tf.function( input_signature=( tf.TensorSpec(shape=[None, None, 3], dtype=tf.float32), tf.TensorSpec(shape=[], dtype=tf.int32), tf.TensorSp原创 2021-05-21 10:20:33 · 2993 阅读 · 0 评论 -
RuntimeError: CUDA error: device-side assert triggered
RuntimeError: CUDA error: device-side assert triggeredterminate called after throwing an instance of ‘c10::Error’/c10d/NCCLUtils.hpp:155, unhandled cuda error, NCCL version 2.7.8分析: 这种报错通过查找博客,发现应该是代码实现中某些地方出了bug,比如label越界,sqrt 内容小于0等。但是笔者从另一个角度给可能存在的bu原创 2021-04-20 09:32:24 · 1347 阅读 · 0 评论 -
The last dimension of the inputs to `Dense` should be defined. Found `None`.
仅仅出现在tf2.1中,在tf2.4中已经不存在该问题。这个问题查询了很多教程都没有很好的解决,其中有一个比较有启发的解决方案是这样的。https://blog.youkuaiyun.com/dldldl0/article/details/79089074ValueError: The last dimension of the inputs to Dense should be defined. Found None. ppp2.shape: (10, ?)这种情况是由于 tf.reshape ()时,设原创 2021-04-12 14:57:10 · 7116 阅读 · 0 评论 -
Could not load dynamic library ‘cusolver64_10.dll cudart64_10.dll
问题:>>> import tensorflow as tf2021-04-12 09:40:47.255940: I tensorflow/stream_executor/platform/default/dso_loader.cc:49] Successfully opened dynamic library cudart64_110.dll>>> tf.test.is_gpu_available()WARNING:tensorflow:From <st原创 2021-04-12 09:48:58 · 770 阅读 · 0 评论 -
tf2报错解决 assertion failed: [predictions must be >= 0] [Condition x >= y did not hold element-wise:]
环境: tf2完整报错如下:tensorflow.python.framework.errors_impl.InvalidArgumentError: assertion failed: [predictions must be >= 0] [Condition x >= y did not hold element-wise:] [x (sub_2:0) = ] [[-nan][-nan][-nan]...] [y (Cast_2/x:0) = ] [0] [[{{no原创 2021-04-12 09:34:30 · 5028 阅读 · 2 评论