2024年大数据Python基础之DataFrame数据结构学习_dd = pd，2024年最新2024年抓住金三银四涨薪好时机-优快云博客

本文链接：https://blog.youkuaiyun.com/2401_84181942/article/details/138803068

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

利用嵌套字典构建DataFrame时，Pandas将字典的键作为列索引，将内部字典的键进行行索引。

d = {'name': {1: 'wang', 2: 'li', 3: 'zhang'}, 'gender': {1: 'M', 2: 'F'}, 'age':{1: 12, 2: 13, 3: 14 }}
dd = pd.DataFrame(d)
print dd

输出：
age gender name
1 12 M wang
2 13 F li
3 14 NaN zhang
3.检索DataFrame
若DataFrame数据量太大，可以用df.head()筛选出最前面的五行。选择一列：类似字典的标记，如df’name’，列名为属性，如df.name(列名是有效的Python变量名)。选择一行：可以使用属性loc返回一个Series对象。如df.loc[1]，其索引的名字即为当前行的列索引“1”，索引名为各列的名字。
4.通过列修改数据

d = {'name': {1: 'wang', 2: 'li', 3: 'zhang'}, 'gender': {1: 'M', 2: 'F'}, 'age':{1: 12, 2: 13, 3: 14 }}
dd = pd.DataFrame(d)
# 标量值
dd.age = 16
# 值数组（长度必须匹配）
dd.age = [60, 61, 30]
# Series对象
dd.age = pd.Series([32, 31, 30], index=[3, 2, 1])
print dd

输出：
age gender name
1 30 M wang
2 31 F li
3 32 NaN zhang

5.重新索引reindex()

df4 = pd.DataFrame(np.arange(9).reshape(3,3), index= ['a', 'b', 'c'], columns=['one', 'two', 'three'])
# 默认对行进行重新索引
df4 = df4.reindex(['a', 'c', 'b'])
# 可以同时对列和行进行索引，缺失值自动用NaN填充，如果不想用NaN，可以在reindex()参数里加入fill_value=n,用n代替缺失值
df4 = df4.reindex(index= ['a', 'c', 'b'], columns=['one', 'three', 'four'])
print df4


![img](https://img-blog.csdnimg.cn/img_convert/3a8809704fefde150ce1a30dcc53e207.png)
![img](https://img-blog.csdnimg.cn/img_convert/190a8167a93b16d8f5d7353c126ed6e0.png)

**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化资料的朋友，可以戳这里获取](https://bbs.youkuaiyun.com/topics/618545628)**


**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**

正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**