
pandas
pandas 语法及使用教程
种麦南山下
莫听穿林打叶声,一蓑烟雨任平生
展开
-
pandas 将得到的对象 添加到excel中
pandas 将得到的对象 添加到excel中,for循环将Series作为新行插入DataFrame原创 2022-11-29 17:36:08 · 483 阅读 · 0 评论 -
pandas 写入或读取excel文件 基础操作
pandas 写入或读取excel文件 基础操作原创 2022-11-29 13:59:03 · 678 阅读 · 0 评论 -
pandas的排序、分组groupby及cumsum累计求和
1、生成一列sum_age 对age 进行累加df['sum_age'] = df['age'].cumsum()print(df)2、生成一列sum_age_new 按照 gender和is_good 对age进行累加df['sum_age_new'] = df.groupby(['gender','is_good'])['age'].cumsum()print(df)3、根据不同的性别对年龄进行排序df['rank_g'] = df.groupby(['gend..原创 2021-11-05 09:25:00 · 18315 阅读 · 0 评论 -
pandas Try using .loc[row_indexer,col_indexer] = value instead
赋值代码:# 对Connection Type分组 并对temp累计求和wsw['Connection Number'] = wsw.groupby(['Connection Type'])['temp'].cumsum()之后控制台警告:Try using .loc[row_indexer,col_indexer] = value instead于是改为wsw.loc[:, 'Connection Number'] = wsw.groupby(['Connection Ty.原创 2021-11-04 18:04:46 · 2636 阅读 · 0 评论 -
pandas日期相减 Timedelta 并换算成分钟
Timedelta 两个日期或时间之间的差异翻译如下:该value属性始终以 ns 为单位。如果精度高于纳秒,则持续时间的精度将被截断为纳秒。a = pd.to_datetime(row_time[i - 1])b = pd.to_datetime(row_time[i])print aprint bprint b-aprint (b-a) / np.timedelta64(1, 'm')# 结果2019-03-02 15:38:402019-03-02 15:3.原创 2021-11-02 17:31:52 · 4616 阅读 · 0 评论 -
pandas.concat 调换列的顺序
data1 = pd.DataFrame({ 'b' : [1, 1, 1], 'a' : [2, 2, 2]})data2 = pd.DataFrame({ 'b' : [1, 1, 1], 'a' : [2, 2, 2]})frames = [data1, data2]data = pd.concat(frames)data#结果 a b0 2 11 2 12 2 10 2 11 2 12 2 1应该b列在前,a列.原创 2021-10-21 17:39:05 · 1382 阅读 · 0 评论 -
pandas 导出csv文件格式时 中文乱码
dff_1.to_csv("foo.csv",encoding='utf-8') 改为:dff_1.to_csv("foo.csv",encoding="utf_8_sig")原创 2021-09-10 13:55:49 · 265 阅读 · 0 评论 -
pandas 的逻辑运算符 | & ~
| 对应or& 对应and~ 对应not原创 2021-09-09 18:32:48 · 13401 阅读 · 2 评论 -
pandas中 append的使用(pandas.DataFrame.append)
api参考:例子:>>> df = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'), index=['x', 'y'])>>> df A Bx 1 2y 3 4>>> df2 = pd.DataFrame([[5, 6], [7, 8]], columns=list('AB'), index=['x', 'y'])>>> df.append.原创 2021-09-09 18:07:09 · 8399 阅读 · 1 评论 -
pandas中的 fillna使用(pandas.DataFrame.fillna)
api参考:fillna:使用指定的方法填充 NA/NaN 值。>>> df = pd.DataFrame([[np.nan, 2, np.nan, 0], [3, 4, np.nan, 1], [np.nan, np.nan, np.nan, 5], [np.nan, 3, np.nan, 4]], columns=list.原创 2021-09-09 17:21:08 · 32543 阅读 · 0 评论 -
pandas中的 loc的使用(pandas.DataFrame.loc)
api参考:其他:例子:一、获取值>>> df = pd.DataFrame([[1, 2], [4, 5], [7, 8]], index=['cobra', 'viper', 'sidewinder'], columns=['max_speed', 'shield'])>>> df max_speed shieldcobra .原创 2021-09-09 16:49:33 · 2924 阅读 · 0 评论 -
pandas中的 shift使用(pandas.DataFrame.shift)
api参考:>>> df = pd.DataFrame({"Col1": [10, 20, 15, 30, 45], "Col2": [13, 23, 18, 33, 48], "Col3": [17, 27, 22, 37, 52]}, index=pd.date_range("2020-01-01", "2020-01-05"))>>> df原创 2021-09-09 13:37:13 · 3004 阅读 · 0 评论 -
pandas中的 DataFrame及Series含义
一、pandas 数据表表示DataFrame是一种二维数据结构,可以在列中存储不同类型的数据(包括字符、整数、浮点值、分类数据等)。数据表存储为DataFrame中。1、 我想存储泰坦尼克号的乘客数据。对于一些乘客,我知道姓名(字符)、年龄(整数)和性别(男/女)数据。# 该表有 3 列,每列都有一个列标签。列标签分别为 Name、Age和Sex。# 列 Name由文本数据组成,每个值都是一个字符串,列 Age是数字,列 Sex是文本数据。In [2]: df = pd.DataF原创 2021-09-09 11:36:28 · 829 阅读 · 0 评论 -
pandas中 concat 的使用
1、结合两个Series。>>> s1 = pd.Series(['a', 'b'])>>> s2 = pd.Series(['c', 'd'])>>> pd.concat([s1, s2])0 a1 b0 c1 ddtype: object2、通过将ignore_index选项设置为 ,清除现有索引并在结果中将其重置True。>>> pd.concat([s1, s2], igno...原创 2021-09-09 10:30:23 · 2121 阅读 · 0 评论 -
pandas的分层索引 (MultiIndex) 讲解
pandas库的名字来源于3种主要数据结构开头字母的缩写:Panel,Dataframe,Series。其中Series表示一维数据,Dataframe表示二维数据,Panel表示三维数据。当数据高于二维时,一般却不用 Panel 表示,一般用包含多层级索引的Dataframe进行表示,而不是使用Panel。原因是使用多层级索引展示数据更加直观,操作数据更加灵活,并且可以表示3维,4维乃至任意维度的数据。# 导包import numpy as npimport pandas as ...原创 2021-09-09 09:45:40 · 25144 阅读 · 1 评论