
pandas
文章平均质量分 51
小何才露尖尖角
任何时候,我对世界总有一个主观的先验判断,但是这个判断会随着世界的真实变化而随机修正,我对世界永远保持开放的态度--Thomas Bayes
展开
-
保存带 numpy.ndarray 的 dataframe
使用 pickle,import picklesave_path = "./result/tmp/text_embedding_df.pkl"with open(save_path, 'wb') as f: pickle.dump(df, f)原创 2024-03-14 11:21:25 · 298 阅读 · 0 评论 -
pandas: groupby() 分组求向量平均值
data.groupby('Pclass')['Fare'].mean()data.groupby('Pclass').mean()['Fare']对向量求均值,向量类型需为 numpy.ndarray,不能为list会报错原创 2024-03-12 12:00:03 · 823 阅读 · 0 评论 -
df 计算同一列时间差(差分pandas.diff())
【代码】df 计算同一列时间差(差分pandas.diff())原创 2024-01-15 10:14:20 · 801 阅读 · 0 评论 -
pandas 将DataFrame 转为txt文本,去除引号问题
此方法会导致原文中多 escapechar=’ ’ 这种空格。原创 2023-11-27 15:39:36 · 1048 阅读 · 0 评论 -
数据等级划分
数据大致可以分为定性数据与定量数据,但细分可以分为四类:定类数据、定序数据、定距数据、定比数据原创 2023-05-28 21:59:24 · 563 阅读 · 0 评论 -
pandas 将行索引转为列
pandas将行索引转为列原创 2023-03-18 11:48:34 · 1743 阅读 · 0 评论 -
pandas 数据处理-Group by操作
使用 “group by” 方式我们通常会有以下一个或几个步骤:Splitting:根据某一准则对数据分组Applying :对每一分组数据运用某个方法Combining :将结果组合为数据结构在上述步骤中,split 方法较直接,在 split 之后我们希望对分组数据做相关计算,在 apply 步骤中我们可能想对数据进行如下操作:Aggregation::聚合操作,对分组数据做汇总统计,如计算sums 或 means、统计分组个数 countsTransformation原创 2022-05-23 11:47:33 · 2064 阅读 · 0 评论 -
10 分钟 pandas-大致了解pandas能做的工作
10 分钟 pandas1 对象创建2 数据可视化3 数据选择3.1 获取数据3.2 根据标签获取数据3.3 根据位置获取数据3.4 布尔索引1 对象创建pandas 中有两种对象, Series 和 DataFrame# Series s = pd.Series([1, 3, 5, np.nan, 6, 8])# DataFramedates = pd.date_range("20130101", periods=6)df = pd.DataFrame(np.random.randn(6,原创 2022-05-21 11:43:24 · 804 阅读 · 0 评论 -
pandas 数据处理-数据结构(Series,DataFrame)
pandas 有两种数据类型,Series 和 DataFrame, DataFrame 可以看作值是 Series 的字典。两者数据标签和数据本身都是内部对其的原创 2022-05-20 16:59:26 · 931 阅读 · 0 评论