【带你快速了解人工智能开发Pandas基础课程第六周】

本文主要介绍了在人工智能开发中,Pandas库的基础使用,包括创建Series和DataFrame,详细讲解了Series的属性如loc、iloc、dtype、shape、size和values,并简述了DataFrame的属性和如何修改、添加、删除及插入列。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。


#博学谷IT学习技术支持#

一、创建series

#在Pandas中,Series是一维容器,Series表示DataFrame的每一列或者每一行
import pandas as pd
s = pd.Series(['apple',10])
s
#在创建series时 可以通过index参数来指定行索引
pd.Series(['apple',10],index=['name','num'])
# 使用一个字典生成Series,其中字典的键,就是索引
s = pd.Series({'apple':1, 'orange':5, 'banana':10}) #series创建字典需要有{}标注
#可以通过索引查找大于2的值
s[s>2]

二、 创建DataFrame

import pandas as pd

name = pd.DataFrame(
    {
        'name':['tom','bob'], 'age':[18,10] ,'job':['teacher','student']
    }
)
name

三、Series的属性

loc使用索引值取子集

iloc使用索引位置取子集

dtype或dtypesSeries内容的类型

shape数据的维数

sizeSeries中元素的数量

valuesSeries的值

代码如下(示例):

四、Dataframe的属性

import pandas as pd
import numpy as np
movie = pd.read_csv('/root/data/movie.csv')
movie.info
#打印行数 列数
movie.shape
#%%
# 打印数据的个数
movie.size
# 该数据集的维度
movie.ndim
# 该数据集的长度
len(movie)
# 各个列的值的个数
movie.count()
# 各列的最小值
movie.min()
movie.describe()
movie.describe(include='all') # 把所有列都进行统计

五、Dataframe的修改

movie.index[:5]#行索引
#%%
movie.columns[:5]#列索引 通常对列改名字 改表头
#%%
idx_rename = {'Avatar':'Ratava', 'Spectre': 'Ertceps'}
col_rename = {'director_name':'Director Name', 'num_critic_for_reviews': 'Critical Reviews'}
movie.rename(index=idx_rename,columns=col_rename).head()
#%%
#如果不使用rename(),也可以将index 和 columns属性提取出来,修改之后,再赋值回去
#%%
movie = pd.read_csv('/root/data/movie.csv', index_col='movie_title')
index = movie.index
columns = movie.columns
index_list = index.tolist()
column_list = columns.tolist()
#%%
index_list
#%%
column_list
#%%
index_list[0] = 'Ratava'
index_list[2] = 'Ertceps'
column_list[1] = 'Director Name'
column_list[2] = 'Critical Reviews'
movie.index = index_list
movie.columns = column_list

六、添加 删除 插入列

#通过dataframe[列名]添加新列
#%%
import pandas as pd
#%%
movie = pd.read_csv('/root/data/movie.csv')
movie['has_seen'] = 0
# 给新列赋值
movie['actor_director_facebook_likes'] = (movie['actor_1_facebook_likes'] +
                                          movie['actor_2_facebook_likes'] +
                                          movie['actor_3_facebook_likes'] +
                                          movie['director_facebook_likes'])
movie = movie.drop('actor_director_facebook_likes', axis='columns')
#labels 要删除的行索引名称或者是列明
#axis 指定按照行还是列删除
#inplace 是否在原始dataframe上进行修改
movie.insert(loc=0,column='profit',value=movie['gross'] - movie['budget'])
movie
#loc 插入位置
#column 插入列的列名
#value 插入列的值

总结

以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。无故而知新

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

あいうえおらりるれろわをん

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值