
Pandas
Hyggef
Do what I want to do to the best of my ability
展开
-
pandas 处理数据节省内存的方法
python pandas处理大数据节省内存的方法数值类型的列进行降级处理 字符串类型的列转化为类别类型(category) 字符串类型的列的类别数超过总行数的一半时,建议使用object类型 '''减少内存的使用'''def reduce_mem_usage(df, verbose=True): numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64', 'object'] start转载 2020-10-29 11:34:24 · 496 阅读 · 0 评论 -
Pandas实现数据类型转换的一些小技巧汇总
前言有关 Pandas 数据类型的一个可能令人困惑的地方是,Pandas、Python 和 numpy 的数据类型之间有一些重叠。大多数情况下,你不必担心是否应该明确地将熊猫类型强制转换为对应的 NumPy 类型。一般来说使用 Pandas 的默认 int64 和 float64 就可以。我列出此表的唯一原因是,有时你可能会在代码行间或自己的分析过程中看到 Numpy 的类型。Pandas、Numpy、Python支持的数据类型从上述表格中可以看出Pandas支持的数据类型最为丰富,在某原创 2020-07-28 20:53:57 · 1413 阅读 · 0 评论 -
pandas agg transform apply 的用法
aggagg方法可以被groupby,DataFrame,Series等对象调用。官网文档语法:df.agg(func, axis=0, *args, **kwargs)参数:func : function, str, list or dict Function to use for aggregating the data. If a function, must either work when passed a DataFrame or when passe原创 2020-07-28 09:12:50 · 996 阅读 · 0 评论 -
Pandas set_index 和reset_index
set_index函数原型:DataFrame.set_index(keys,drop=True,append=False,inplace=False,verify_integrity=False)参数解释:keys–label or array-like or list of labels/arraysThis parameter can be either a single column key, a single array ofthe same length as the calli原创 2020-07-24 17:36:57 · 867 阅读 · 0 评论