pandas中的.astype()使用规范问题——以.astype(int)的一种str类型数据转int类型数据报错为例

最新推荐文章于 2024-12-26 10:31:24 发布

原创最新推荐文章于 2024-12-26 10:31:24 发布 · 2.1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #python

该代码段导入Pandas库并读取CSV文件。然后，它将身份证号列转换为字符串类型，并通过for循环遍历身份证号，根据第13位数字的奇偶性确定性别。当遇到错误时，指出astype()函数应应用于整数而不是字符串。

# 导入pandas，并使用"pd"作为该模块的简写
import pandas as pd

# 使用read_csv()函数，获取文件"/Users/count/住户信息.csv"，并赋值给data
data = pd.read_csv("/Users/count/住户信息.csv")

# TODO 使用astype()函数，将data["身份证号"]转换为str类型
data["身份证号"] = data["身份证号"].astype(str)

# 创建储存性别的空列表gender
gender = []

# TODO 使用for循环遍历data["身份证号"]
for ID in data["身份证号"]:
    
    # TODO 将身份证号的第13位([12])转换为int，并赋值给num
        num = ID[12].astype(int)

    # TODO 如果num是奇数
        if num%2 == 1:

        # TODO 在gender列表中添加"男"
            gender.append("男")

    # TODO 如果num是偶数
        else:
           
    

        # TODO 在gender数组中添加"女"
             gender.append("女")

# TODO 将gender赋值给data["性别"]
data["性别"] = gender

# TODO 使用print()输出data
print(data)

报错信息：

File "/code/code.py", line 18
    num = ID[12].astype(int)
      ^
SyntaxError: invalid syntax

我们追溯到报错所在的代码：

num = ID[12].astype(int)

这句代码之所以出错，是因为ID[12]是单独的一个str对象，而不是Series或DataFrame对象，因此出现报错。正确的代码应为：

num = int(ID[12])

总结：`.astype()`只能作用于`Series`或`DataFrame`对象，而对于单独的一个数据所构成的对象使用会报错！