
Pandas笔记
xLyons
小小研究生一枚,研究方向为推荐系统...
展开
-
pandas.series转DataFrame
示例: # items_set = source_data.loc[:, 'item_id'].to_frame()使用to_frame()即可,类似还有to_list()…原创 2021-12-23 15:19:35 · 775 阅读 · 0 评论 -
pandas.groupby.agg函数
示例如下: items_set = source_data.groupby(['item_id'])['user_id'].agg( [('count_col', 'count')] ).reset_index()新的列名为count_col,对聚合后的分组执行count函数。还可以执行mean,max等函数…原创 2021-12-23 15:17:18 · 766 阅读 · 0 评论 -
pd.set_option
import warningswarnings.filterwarnings('ignore')# 设置显示最大的列数(None表示全部显示)和行数pd.set_option('display.max_columns', None)pd.set_option('display.max_rows', 100)# 设置显示小数保留的位数pd.set_option('display.float_format',lambda x: '%.2f'%x)# pandas设置显示宽度pd.set_opt原创 2021-10-11 11:54:21 · 1395 阅读 · 0 评论 -
pandas.apply加速-使用swifter
Swfiter是一个库,它“以最快的可用方式将任何函数应用到 Pandas DataFrame(数据框)或Series(序列)。”。Swfiter安装Swifter安装swifter用pip直接安装即可,很方便。$ pip install -U pandas # upgrade pandas$ pip install swifter # first time installation$ pip install -U swifter # upgrade to latest version if a原创 2021-09-01 10:10:55 · 2927 阅读 · 0 评论 -
Pandas读取字典&一行拆多行
一、字典转换为DataFrame我们现在有一个字典变量feed_data,其格式如下:每个键对应的值为list,那么怎样将其转换为DataFrame呢?可以先将其读取为pd.Series();然后,通过pd.DataFrame将其转换为DataFrame格式;代码如下:pd.DataFrame(pd.Series(feed_data), columns=['pos_items'])结果如下:再整理一下数据格式,对列重命名:feed_pd = feed_pd.reset_inde原创 2021-08-30 11:13:31 · 880 阅读 · 0 评论 -
遍历Pandas.DataFrame的行
使用方法itertuples():for row in df.itertuples(): print(getattr(row, 'feat_1'))通过getattr,可以取出行row列名为feat_1对应的元素值。原创 2021-08-13 11:56:39 · 279 阅读 · 0 评论