
pandas
德德德真的是我
英雄梦 噢!!!
展开
-
Pandas 日期时间列里删除时间,只保留日期
提醒自己不要用dt.date踩过的坑很可能转换完格式之后不对筛选不出来 - 虽然我也不知道为什么首先这是我们的raw_data可以看到这列是 日期 + 时间 的格式现在我想把日期和时间分开 用pandassample_event['Install_date'] = pd.to_datetime(sample_event['Install Time'])sample_event['Install_date'] = sample_event['Install_date'].apply(lambd原创 2021-11-04 16:10:38 · 4210 阅读 · 1 评论 -
Pandas 实现excel类似vlookup 的匹配功能 (apply, merge, join)
Excel的vlookup功能在数据量太大的前提下就挺难用的,所以还是需要pandas搞定下面是用pandas实现匹配的方法如下图,假如我有一个表 全是印尼文 A有另一张在google sheet上翻译出来的表 B现在我想匹配第一张表 category1_name 的英文版本1. dict + apply 我觉得最好的方法首先将翻译的那张表转成字典形式import pandas as pddict1 = dict(zip(trans['Indonesian'],trans['Engli原创 2021-08-09 14:46:50 · 7670 阅读 · 3 评论 -
Pandas在groupby中保留所有字段 - transform用法
比如说我现在有一些数据,商品id和商品名称不是一一对应的,但是实际上是一个商品,只是略微改了名称现在我的目的是计算每个商品的销售量,销售额,因为商品名称有略微改变,所以我直接保存第一次出现的商品名称,使得每个商品只有一条数据以防报警告我先复制一下samplecopy = sample.copy()现在我们对sample按照sku_id进行聚合,得到的volume和value是我们最终想要的,我们把这个volume和value直接transform到copy后的数据中,得到这样的数据然后我们可原创 2021-07-28 09:11:43 · 3113 阅读 · 0 评论 -
Pandas分组(groupby)迭代合并输出 - 选取当前行之前的最大值
需求:添加一列,对每一个商品选取 在当前日期之前,sold_volme最大值首先添加这个列,辅助赋值import pandas as pdimport numpy as npsample['greatest_volume'] = 0然后创建分组grouped_sample = sample.groupby('sku_name')创建一个空的dataframedf = pd.DataFrame()接下来用for循环,先遍历每一个group,然后在每一个group里面操作,最后合并原创 2021-07-27 16:04:02 · 561 阅读 · 0 评论