
Pandas库
Pandas库函数
方如一
这个作者很懒,什么都没留下…
展开
-
Pandas库-replace
df.replace(Value_old,Value_new) Value_old是需换值,Value_new是替换值。注意,此时原DataFrame是并没有改变的,改变的只是一个复制品。df.replace(Value_old,Value_new,inplace=TRUE)Value_old是需换值,Value_new是替换值。df改变了。...原创 2022-05-27 16:57:57 · 314 阅读 · 0 评论 -
Pandas库-dt.time
series.dt.time获取series的时间属性(时分秒),其中series是靠to_datetime获取的标准日期列import pandas as pdsr = pd.Series(['2012.10.21 09:30', '2019.7.18 12:30', '2008-02-2 10:30', '2010-4-22 09:25', '2019-11-8 02:22'])idx = ['Day 1', 'Day 2', 'Day 3', 'Day .原创 2022-05-27 16:49:17 · 521 阅读 · 0 评论 -
Pands库-to_datetime
dataset['A']=pd.to_datetime(dataset['A'])读取数据dataset的A列,并将该时间列转为datetime格式,即2012-10-21 09:30:00import pandas as pdsr = pd.Series(['2012.10.21 09:30', '2019.7.18 12:30', '2008-02-2 10:30', '2010-4-22 09:25', '2019-11-8 02:22'])idx =..原创 2022-05-27 16:35:29 · 136 阅读 · 0 评论 -
head( )函数(Pandas库)
dataset=pd.read_csv( "AEP_hourly.csv") #dataset数据原本是[121273 rows x 2 columns]dataset.head()print(dataset) #依然输出[121273 rows x 2 columns]数据名.head( ) :是指取数据的前n行数据,默认是前5行。需要注意的是没有print语句,python中的head()函数只是选择数据,而不对它做任何事情。dataset=pd.read_csv( "AEP_hour..原创 2022-03-11 11:42:33 · 34080 阅读 · 0 评论 -
iterrows( )函数(Pandas库)
Pandas的基础结构可以分为两种:数据框(dataframe)和序列(sequence)。Dataframe是有行标签和列标签的矩阵 ,列标签是表头,行标签是索引值。iterrows( )针对dataframe可以返回每行的索引值和每行本身所有的对象。for index, row in dataset.iterrows(): #datast是我自己的数据集[121273 rows x 2 columns] print(index,row)...原创 2022-03-11 14:14:53 · 22387 阅读 · 0 评论 -
str.split(“分割符“, 分割次数)(Pandas库)
split( )函数用来切割strstr.split("分割符", 分割次数).“分隔符”为默认值时,认为空格,\n,\t等都是是分隔符;分割次数默认是-1即分割所有,num=1时即分割一次,num=2时即分割两次,以此类推。a= "123 \n456 \n789"print(a.split()) #分隔符为默认结果是['123', '456', '789']a= "123 \n456 \n789"print(a.split(' ',2)) #注意这里的分割是空格,以空格为分隔原创 2022-03-11 19:50:40 · 10799 阅读 · 0 评论 -
groupby( )(Pandas库)
df.groupbydataset_new.groupby(by='Datetime')['AEP_MW'].sum()*0.00001df[](指输出数据的结果属性名称).groupby([df[属性],df[属性])(指分类的属性,数据的限定定语,可以有多个).mean()(对于数据的计算方式——函数名称)...原创 2022-03-11 21:34:17 · 1127 阅读 · 0 评论 -
read_csv
问题:如何读取csv文件方法:从pandas库中读取,pandas.read_csv(‘文件路径’)或者pandas.read_csv(‘文件名’)1.pandas.read_csv(‘文件路径’)文件可以放在某个特定的文件夹里,比如说我放在D盘data文件夹下:#代码import pandasdf = pandas.read_csv('D:/data/a.csv')print(df)#结果 姓名 班级 分数0 小明 302 871 小王 303原创 2022-02-24 16:20:33 · 5637 阅读 · 0 评论 -
iloc[ ]函数(Pandas库)
问题:iloc函数是干什么的?回答:在数据分析过程中,很多时候需要从数据表中提取出相应的数据,而这么做的前提是需要先“索引”出这一部分数据。iloc函数,属于pands库,全称为index location,即对数据进行位置(location)索引(index)。问题:iloc函数怎么用?回答:iloc[a,b],其中a是行数,b是列数。具体a和b的输入有以下几种形式:1.iloc[a,b]:取第a行第b列的数据。注意,在iloc中认为数据中的行数和列数都是如图这样定义的图1...原创 2022-02-25 12:27:25 · 152973 阅读 · 7 评论 -
df.reset_index( )函数(Pandas库)
df.reset_index( )函数:重置索引直接生成一个新DataFrame或Seriesdf.reset_index(level, drop=False)level:drop:默认为False,即原来的行索引列会作为新的一列。如果drop=True,则原来的行索引列被弃1 df.reset_index(drop=False):将原来的行索引列作为新的一列,生成一个新dfimport pandas as pddf =pd.DataFrame({'a':[0,1,2],'b':[原创 2022-03-21 16:26:52 · 15454 阅读 · 0 评论