Python读取csv错误

最新推荐文章于 2024-06-11 19:43:45 发布

原创最新推荐文章于 2024-06-11 19:43:45 发布 · 513 阅读

0 ·

CC 4.0 BY-SA版权

python 专栏收录该内容

12 篇文章

订阅专栏

本文记录了在使用Python读取CSV数据时，如何正确判断字段是否有值以避免多线程环境中出现的问题。错误的使用dict.get('x')可能导致请求长度与原始输入不一致，进而使结果错乱。解决方案是使用dict.get('x', 'default')来确保即使字段为空，请求长度也会保持一致。" 109784407,9580424,力扣刷题心得与C++解法,"['算法', 'C++', '力扣', '编程题']

昨天改bug改了一下午，一个很简单的细节，却很容易被忽视，特记录一下。

在用python读取csv数据时,如果想判断某一个字段是否有值，可以写成：

reader = csv.Dicteader(inputFile)
tmp_lst = []
for row in reader:
	if row.get('xxx):
		tmp_list.append(row['xxx'])

这样写，如果是多线程调用服务并接受返回值的话，可能会引起很大的问题，例如

#将调服务的返回值加到输入中
def cpAttr(e={}, ne={}):
    try:
        for k, v in ne.items():
            e[k] = v.encode('utf-8')
    except Exception as ex:
        pass
#线程调用的函数
def handle(data_list, thread_name):
    p = []
    for e in data_list:
        if e.get('a') :
            p.append(e['a'])
    ps = {'splits': p}
    data = json.dumps(ps)
    url = "xxx"
    req = urllib2.Request(url=url, data=data, headers=headers)
    response = urllib2.urlopen(req)
    resp = response.read()
    results = json.loads(resp)
    for i in range(len(data_list)):
        cpAttr(data_list[i], results[i])

如果这里用 if dict.get(‘x’)来判断字典是否有值，就会有问题，因为如果这一字段是空值就不会被加入到请求的json中，也就是说请求长度跟原始输入长度不一致，就会导致输出结果全部错乱，所以这里应该写成：

def handle(data_list, thread_name):
    p = []
    for e in data_list:
    	#要判断不为空值
        if e.get('a') is not None :
            p.append(e['a'])
    ps = {'splits': p}
    data = json.dumps(ps)
    url = "xxx"
    req = urllib2.Request(url=url, data=data, headers=headers)
    response = urllib2.urlopen(req)
    resp = response.read()
    results = json.loads(resp)
    for i in range(len(data_list)):
        cpAttr(data_list[i], results[i])