Pandas & Numpy：盲点

最新推荐文章于 2025-05-30 17:30:29 发布

发烧的小龙虾

最新推荐文章于 2025-05-30 17:30:29 发布

阅读量224

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/shijie97/article/details/100033694

本文揭示了在使用Pandas和Numpy时容易遇到的一些盲点，包括构造DataFrame时指定index的影响，permutation与shuffle的区别，np.pad的用法，以及如何正确地进行切片操作、维度转换和数据索引等。特别强调了在处理数据帧时，保持index的一致性和正确使用loc和iloc的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. Pandas中，如果用字典构造系列和数据帧，如果强行指定index或者column，则以强行指定的为准，指定的index或者column中没有，但是字典本身有的数据将被忽略，指定的index或者column中有，但是字典本身没有的数据将被置NaN

2. DataFrame的某一列为Series，则DataFrame的index必须和Series的index一样，不然所有数据都将是NaN，因此使用这种方式的时候，最好的方法就是数据帧构建过程中不设置index，而是在每一个Series构建的时候构造相同的index，如下

# !user/bin/python
# -*- coding: UTF-8 -*-

import numpy as np
import pandas as pd

# 数据帧的选择

dic = {'col1' : pd.Series(np.arange(4),index = ['one', 'two', 'three', 'four']),
       'col2' : pd.Series(np.arange(100, 100 + 4), index = ['one', 'two', 'three', 'four'])}
df = pd.DataFrame(dic)
print(df)

#        col1  col2
# one       0   100
# two       1   101
# three     2   102
# four      3   103