python导出csv 字符串变成数字_python – pandas read_csv列dtype设置为十进制但转换为字符串...

我正在使用pandas(v0.18.1)从名为’test.csv’的文件中导入以下数据:

a,b,c,d

1,1,1,1.0

我已经为列’c’和’d’将dtype设置为’decimal.Decimal’,而是将它们作为’str’类型返回.

import pandas as pd

import decimal as D

df = pd.read_csv('test.csv', dtype={'a': int, 'b': float, 'c': D.Decimal, 'd': D.Decimal})

for i, v in df.iterrows():

print(type(v.a), type(v.b), type(v.c), type(v.d))

结果:

``

我也尝试在导入后显式转换为十进制,没有运气(转换为浮点数但不是十进制数).

df.c = df.c.astype(float)

df.d = df.d.astype(D.Decimal)

for i, v in df.iterrows():

print(type(v.a), type(v.b), type(v.c), type(v.d))

结果:

``

下面的代码将’str’转换为’decimal.Decimal’,所以我不明白为什么pandas的行为方式不同.

x = D.Decimal('1.0')

print(type(x))

结果:

``

在使用pandas.read_csv读取CSV文件时,如果将dtype参数设置成float,而CSV文件中包含字符串,就会导致报错。处理这种情况的方法有以下几种: 1. **指定dtype**: 你可以为每一单独指定dtype,而不是将整个DataFrame的dtype设置为float。这样可以确保只有数值转换为float,而字符串保持为object类型。 ```python import pandas as pd df = pd.read_csv('file.csv', dtype={'numeric_column': float, 'string_column': str}) ``` 2. **使用`converters`参数**: 你可以使用`converters`参数为特定的指定转换函数。对于数值,可以使用`float`,对于字符串,可以直接返回原值。 ```python import pandas as pd def convert_to_float(x): return float(x) def convert_to_string(x): return str(x) df = pd.read_csv('file.csv', converters={'numeric_column': convert_to_float, 'string_column': convert_to_string}) ``` 3. **先读取所有字符串,再转换**: 你可以先读取所有字符串类型,然后手动将需要转换为float的进行转换。 ```python import pandas as pd df = pd.read_csv('file.csv', dtype=str) df['numeric_column'] = df['numeric_column'].astype(float) ``` 4. **使用`error_bad_lines`参数**: 如果你确定某些行中的字符串可以忽略,可以使用`error_bad_lines`参数来跳过这些行。 ```python import pandas as pd df = pd.read_csv('file.csv', dtype=float, error_bad_lines=False) ``` 通过这些方法,你可以避免在读取CSV文件时因为dtype设置不当而导致的问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值