1.显示全部数据|将 DataFrame 或 Series 转换为字符串

使用.to_string()后缀可以生成一个可滑动窗格,里面可查看所有数据(当数据量较大时,默认情况下,Pandas 只会显示部分数据而不是全部。使用 .to_string() 方法可以强制 Pandas 显示所有的数据,而不是进行省略显示。)
2.将文本变量Cabin用数值变量12345...表示
先打印文本变量Cabin:

可以发现Cabin中除了含有大量的NaN外还有很多杂乱的文本变量,如果想用.map()更改变量表示,一个一个打字典的键值对太过麻烦,所以我们要先设法通过【遍历】来创建一个符合条件的字典:

如图,我们想要的字典出现啦,但是笔者在运行过程中发现NaN是一个很特殊的数值,后两行代码是为了在字典里不上之前在value_counts里没出现的NaN,但后面的运行中其实没起作用。

这里出了点意外,重新导入了文件并命名为pf(所以不是重点!)因为就剩一个NaN了,所以我们直接采用.fillna()来替换为0,这样就全部是数值表示啦!
本文介绍了如何使用Pandas的.to_string()方法显示大型DataFrame或Series的全部数据,以及如何通过遍历和字典映射将文本变量Cabin转换为数值表示,包括处理缺失值NaN的过程。

被折叠的 条评论
为什么被折叠?



