pandas

zxy.....

已于 2023-02-02 14:03:17 修改

阅读量572

点赞数

CC 4.0 BY-SA版权

文章标签： pandas python 数据分析

于 2023-02-02 10:55:43 首次发布

本文链接：https://blog.youkuaiyun.com/qq_47332253/article/details/128821288

本文详细介绍了pandas库的常用函数，包括如何创建DataFrame、增删查改DataFrame的方法，以及pandas读写文件的参数详解。在读写文件部分，详细阐述了read_csv和read_excel的参数，如filepath_or_buffer、sep、header、names等，并提供了DataFrame的to_csv和to_excel的参数说明，如path_or_buf、float_format、index、header等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

pandas常用函数

pandas详解 https://blog.youkuaiyun.com/qq_41854911/article/details/122696986

创建DataFrame

字典嵌套列表创建
data 字典中，键对应的值的元素长度必须相同（也就是列表长度相同）。如果传递了索引，那么索引的长度应该等于数组的长度；如果没有传递索引，那么默认情况下，索引将是 range(n)，其中 n 代表数组长度。

import pandas as pd
data = {
   
   'Name':['Tom', 'Jack', 'Steve', 'Ricky'],'Age':[28,34,29,42]}
df = pd.DataFrame(data)
print(df)

      Age      Name
0     28        Tom
1     34       Jack
2     29      Steve
3     42      Ricky

列表嵌套字典创建DataFrame对象
列表嵌套字典可以作为输入数据传递给 DataFrame 构造函数。默认情况下，字典的键被用作列名。
注意：如果其中某个元素值缺失，也就是字典的 key 无法找到对应的 value，将使用 NaN 代替。

import pandas as pd
data = [{
   
   'a': 1, 'b': 2},{
   
   'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
print(df)

    a    b      c
0   1   2     NaN
1   5   10   20.0

DataFrame增删查改

增

列索引添加数据列
使用 columns 列索引表标签可以实现添加新的数据列，示例如下：

import pandas as pd
d = {
   
   'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
   'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
#使用df['列']=值，插入新的数据列
df['three']=pd.Series([10,20,30],index=['a','b','c'])
print(df)
#将已经存在的数据列做相加运算
df['four']=df['one']+df['three']
print(df)

使用列索引创建新数据列:
     one   two   three
a    1.0    1    10.0
b    2.0    2    20.0
c    3.0    3    30.0
d    NaN    4    NaN

已存在的数据列做算术运算：
      one   two   three    four
a     1.0    1    10.0     11.0
b     2.0    2    20.0     22.0
c     3.0    3    30.0     33.0
d     NaN    4     NaN     NaN

上述示例，我们初次使用了 DataFrame 的算术运算，这和 NumPy 非常相似。除了使用df[]=value的方式外，您还可以使用 insert() 方法插入新的列，示例如下：

import pandas as pd
info=[['Jack',18],['Helen',19],['John',17]]
df=pd.DataFrame(info,columns=['name','age'])
print(df)

最低0.47元/天解锁文章

200万优质内容无限畅学