tf.decode_csv() error: “Unquoted fields cannot have quotes/CRLFs inside”

本文介绍了在使用TensorFlow运行深度神经网络(DNN)时遇到的'Unquoted fields cannot have quotes/CRLFs inside'异常的解决方法。问题源于数据中的引号和回车换行符。解决方案包括设置`tf.decode_csv`的`use_quote_delim=False`来处理引号,以及替换掉数据中的回车换行符。通过理解源码和调整参数,可以成功解决这个问题。
部署运行你感兴趣的模型镜像

一、背景

今天基于TensorFlow跑DNN,报了一个异常InvalidArgumentError (see above for traceback): Unquoted fields cannot have quotes/CRLFs inside”,在decode csv文件的时候报上面这个错,中文解释是“未加引号的字段中不能包含引号/ CRLF”,异常如下:
在这里插入图片描述

二、解决

1.处理引号

本实验中DNN的训练集是将各个特征通过’\t’进行拼接,通过异常显示应该是字符串中有引号,导致在decode的时候无法区分拼接的特征,使得抛出了异常,google了一波,找到了答案,在tf.decode_csv()函数中,有个参数是use_quote_delim 参数,看原始代码的解释为:

se_quote_delim: An optional bool. Defaults to True.
If false, treats double quotation marks as regular
characters inside of the string fields (ignoring RFC 4180, Section 2,
Bullet 5).

此参数默认True,会把双引号当成引用,在使用tf.decode_csv读取文件的时候如果某一行有双引号会报错。

所以需要将其设置为False,这样就会把双引号当做为一个普通的字符串变量,在这里读取不会报错,如下:

在这里插入图片描述

code如下:

features_tuple = tf.decode_csv(raw_features, use_quote_delim=False,record_defaults=features_default,field_delim="\t")

总结:添加use_quote_delim=False或者数据中去除",一般情况这样处理了就不会再报错了,但use_quote_delim=False只能处理双引号"的情况,无法处理回车换行的问题。

2.处理回车换行

有的时候,在数据清洗阶段并未做的很好,在特征中存在了一些回车(CR, ASCII 13, “\r”) 换行(LF, ASCII 10, “\n”)时,也会抛此异常。

小编翻看了tensorflow这段的源码:https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/decode_csv_op.cc,如下:
在这里插入图片描述

存在回车换行符也会抛异常。

解决:将训练集中的回车换行全部替换成空串,重新训练

三、总结

经过以上两步,“Unquoted fields cannot have quotes/CRLFs inside”此异常彻底解决了。

经验总结:当使用一些开源框架时,出现了异常,莫慌,先google一波,如果发现google也没办法解决你的问题,直接看对应的源码,分析一下源码,找到是什么原因?什么条件导致这个异常产生,既能快速解决问题,也让你的技术得到了提升。

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

<think>好的,我现在需要帮助用户解决他们遇到的另一个FFmpeg编译错误。用户这次的问题是关于“taking address of temporary array”,出现在libavutil/error.h的第122行。让我仔细看看错误信息,并回忆之前的解决经验。 首先,用户提供的错误信息指出在avutil的error.h文件中,有一个临时数组的地址被获取的问题。具体来说,错误发生在av_make_error_string宏展开时,用户代码中使用了av_err2str(ret),而这里可能涉及到一个临时数组的问题。 我记得FFmpeg中的av_err2str宏在旧版本和新版本之间可能有变化。用户之前遇到的const问题可能也是由于FFmpeg版本更新导致的API变化。现在这个错误同样可能涉及到宏定义的改动。 让我先回忆一下av_err2str的实现。在旧版本的FFmpeg中,av_err2str宏可能使用了复合字面量(compound literal)来创建一个临时数组,然后将这个临时数组的地址传递给av_make_error_string函数。C/C++中,临时对象的生命周期仅限于当前表达式,因此获取其地址并在之后使用会导致未定义行为。不过,在宏展开时,可能这个临时数组被直接使用在表达式中,所以编译器可能允许。但在某些情况下,尤其是C++中,对临时变量的地址获取可能更严格,导致编译错误。 现在用户的错误提示是“taking address of temporary array”,这说明在宏展开时,确实尝试获取了一个临时数组的地址,而编译器不允许这样做。这可能是因为用户在使用C++编译器,而C++对于复合字面量的支持不如C语言,或者FFmpeg的宏在C++中的行为不同。 接下来,我需要确认av_err2str宏的定义。根据错误信息中的代码片段,av_make_error_string的第一个参数是一个复合字面量(char[AV_ERROR_MAX_STRING_SIZE]){0},这确实创建了一个临时数组。然后,这个临时数组的地址被传递给av_make_error_string函数。问题在于,当这个宏在C++代码中使用时,临时数组的生命周期结束于表达式结束,因此其地址在后续使用中可能无效,但这里可能是在同一行使用,所以可能问题在于C++不允许这种用法,或者用户使用的编译器版本对此有更严格的检查。 用户代码中的错误出现在decode_file.cpp的第70行,使用av_err2str(ret)输出错误信息。这里可能因为宏展开后的代码在C++中不被接受,导致编译错误。 解决方案方面,我需要考虑如何避免使用临时数组的地址。可能的解决办法包括: 1. 修改宏的使用方式,避免临时数组。例如,使用一个局部变量来存储错误字符串,再传递其地址。 2. 使用FFmpeg提供的其他函数或宏来替代av_err2str,比如直接调用av_strerror函数并传入一个预先分配好的缓冲区。 3. 检查用户是否在使用C++编译器,而该宏是为C设计的,可能需要调整代码以适应C++的限制。 根据之前的经验,av_err2str宏在C++中可能会出现问题,因为复合字面量在C++中不被支持,或者其作用域规则不同。因此,正确的做法是建议用户避免使用该宏,改用其他方法,例如定义一个局部数组,然后使用av_strerror函数填充错误信息。 例如,用户可以将代码中的av_err2str(ret)替换为: char errbuf[AV_ERROR_MAX_STRING_SIZE]; av_strerror(ret, errbuf, sizeof(errbuf)); qDebug() << "接收帧错误:" << errbuf; 这样可以避免使用临时数组的地址,因为errbuf是一个局部变量,其生命周期在整个作用域内有效。 此外,需要提醒用户检查FFmpeg的文档,确认av_err2str是否在C++环境下被推荐使用,或者是否有其他替代方法。同时,可能需要查看用户使用的FFmpeg版本,因为不同版本的宏定义可能有所变化,导致兼容性问题。 总结来说,这个问题的根源在于av_err2str宏在C++中的使用导致临时数组地址的问题,解决办法是改用显式的局部变量和av_strerror函数来生成错误信息字符串。</think>--- ### **问题分析** 这个编译错误是由于在 C++ 中使用了 FFmpeg 的 `av_err2str` 宏导致的。该宏内部通过**复合字面量**(Compound Literal)生成一个临时数组,而 C++ **不允许获取临时数组的地址**(C 语言允许但 C++ 限制更严格)。在 C++ 中,临时对象的生命周期仅限于当前表达式,获取其地址会导致未定义行为。 --- ### **直接解决方案** 用 **`av_strerror()` 函数**替代 `av_err2str` 宏,手动定义缓冲区存储错误信息: ```cpp // 原代码(错误) qDebug() << "接收帧错误:" << av_err2str(ret); // 修改后(正确) char errbuf[AV_ERROR_MAX_STRING_SIZE]; av_strerror(ret, errbuf, sizeof(errbuf)); qDebug() << "接收帧错误:" << errbuf; ``` --- ### **深入解释** #### 1. **`av_err2str` 宏的底层实现** 在 `libavutil/error.h` 中,`av_err2str` 宏定义如下: ```c #define av_err2str(errnum) \ av_make_error_string((char[AV_ERROR_MAX_STRING_SIZE]){0}, AV_ERROR_MAX_STRING_SIZE, errnum) ``` - 这里通过 `(char[AV_ERROR_MAX_STRING_SIZE]){0}` 创建了一个**临时数组**。 - 在 C++ 中,临时数组的地址不能直接传递(即使在同一行),因为其生命周期仅限当前表达式。 #### 2. **C 与 C++ 的差异** - **C 语言**:允许获取临时数组的地址,只要在同一表达式中使用。 - **C++**:严格禁止此操作,因为临时对象的地址会被视为悬垂指针。 --- ### **扩展建议** #### 1. **检查所有 `av_err2str` 的使用** 若代码中有多处类似调用,需逐一替换为 `av_strerror`: ```cpp // 错误示例 printf("Error: %s\n", av_err2str(ret)); // 正确替换 char errbuf[AV_ERROR_MAX_STRING_SIZE]; av_strerror(ret, errbuf, sizeof(errbuf)); printf("Error: %s\n", errbuf); ``` #### 2. **封装工具函数(可选)** 为简化代码,可封装一个辅助函数: ```cpp inline const char* ffmpeg_error_string(int errnum) { static thread_local char errbuf[AV_ERROR_MAX_STRING_SIZE]; av_strerror(errnum, errbuf, sizeof(errbuf)); return errbuf; } // 使用方式 qDebug() << "错误信息:" << ffmpeg_error_string(ret); ``` --- ### **错误示例与修正对比** | **错误代码** | **修正后代码** | |--------------|----------------| | `av_err2str(ret)` | `av_strerror(ret, errbuf, sizeof(errbuf))` | --- ### **附加说明** - **为何 FFmpeg 使用这个宏?** 该宏是为 C 语言设计的,利用了 C 的复合字面量特性,但在 C++ 中不兼容。 - **其他潜在问题** 如果代码中混用了 C 和 C++ 的编译单元(如直接包含 C 头文件),需确保 `extern "C"` 正确应用。 --- ### **总结** 1. **直接修复**:用 `av_strerror` 替代 `av_err2str` 宏。 2. **代码兼容性**:注意 C/C++ 的差异,尤其涉及临时对象时。 3. **长期维护**:封装工具函数可提升代码可读性和安全性。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值