【带你快速了解人工智能开发Pandas基础课程第六周】-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_44126780/article/details/124573749

本文主要介绍了在人工智能开发中，Pandas库的基础使用，包括创建Series和DataFrame，详细讲解了Series的属性如loc、iloc、dtype、shape、size和values，并简述了DataFrame的属性和如何修改、添加、删除及插入列。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

前言

例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。

#博学谷IT学习技术支持#

一、创建series

#在Pandas中，Series是一维容器，Series表示DataFrame的每一列或者每一行
import pandas as pd
s = pd.Series(['apple',10])
s
#在创建series时 可以通过index参数来指定行索引
pd.Series(['apple',10],index=['name','num'])
# 使用一个字典生成Series，其中字典的键，就是索引
s = pd.Series({'apple':1, 'orange':5, 'banana':10}) #series创建字典需要有{}标注
#可以通过索引查找大于2的值
s[s>2]

二、创建DataFrame

import pandas as pd

name = pd.DataFrame(
    {
        'name':['tom','bob'], 'age':[18,10] ,'job':['teacher','student']
    }
)
name

三、Series的属性

loc使用索引值取子集

iloc使用索引位置取子集

dtype或dtypesSeries内容的类型

shape数据的维数

sizeSeries中元素的数量

valuesSeries的值

代码如下（示例）：

四、Dataframe的属性

import pandas as pd
import numpy as np
movie = pd.read_csv('/root/data/movie.csv')
movie.info
#打印行数 列数
movie.shape
#%%
# 打印数据的个数
movie.size
# 该数据集的维度
movie.ndim
# 该数据集的长度
len(movie)
# 各个列的值的个数
movie.count()
# 各列的最小值
movie.min()
movie.describe()
movie.describe(include='all') # 把所有列都进行统计

五、Dataframe的修改

movie.index[:5]#行索引
#%%
movie.columns[:5]#列索引 通常对列改名字 改表头
#%%
idx_rename = {'Avatar':'Ratava', 'Spectre': 'Ertceps'}
col_rename = {'director_name':'Director Name', 'num_critic_for_reviews': 'Critical Reviews'}
movie.rename(index=idx_rename,columns=col_rename).head()
#%%
#如果不使用rename()，也可以将index 和 columns属性提取出来，修改之后，再赋值回去
#%%
movie = pd.read_csv('/root/data/movie.csv', index_col='movie_title')
index = movie.index
columns = movie.columns
index_list = index.tolist()
column_list = columns.tolist()
#%%
index_list
#%%
column_list
#%%
index_list[0] = 'Ratava'
index_list[2] = 'Ertceps'
column_list[1] = 'Director Name'
column_list[2] = 'Critical Reviews'
movie.index = index_list
movie.columns = column_list

六、添加删除插入列

#通过dataframe[列名]添加新列
#%%
import pandas as pd
#%%
movie = pd.read_csv('/root/data/movie.csv')
movie['has_seen'] = 0
# 给新列赋值
movie['actor_director_facebook_likes'] = (movie['actor_1_facebook_likes'] +
                                          movie['actor_2_facebook_likes'] +
                                          movie['actor_3_facebook_likes'] +
                                          movie['director_facebook_likes'])

movie = movie.drop('actor_director_facebook_likes', axis='columns')
#labels 要删除的行索引名称或者是列明
#axis 指定按照行还是列删除
#inplace 是否在原始dataframe上进行修改

movie.insert(loc=0,column='profit',value=movie['gross'] - movie['budget'])
movie
#loc 插入位置
#column 插入列的列名
#value 插入列的值

总结

以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。无故而知新