
Pandas_Numpy
文章平均质量分 72
Roaring Kitty
供应链算法专家,量化交易爱好者,You Only Live Once!,技术交流:AllenYZXL
展开
-
Pandas之drop_duplicates:去除重复项
本文,我们讲述Pandas如何去除重复项的操作,我们选择一个评价数据集来演示如何删除特定列上的重复项,如何删除重复项并保留最后一次出现,以及drop_duplicates的默认用法原创 2017-11-17 11:15:49 · 334917 阅读 · 16 评论 -
Numpy之random.randint产生随机整数
本文主要讲述了如何使用Numpy的random.randint来产生随机整数,我们演示了如何生成不同上限或下限的指定大小的数组原创 2017-11-18 16:11:55 · 110736 阅读 · 0 评论 -
Pandas之skew,求偏度
skew定义偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。偏度(Skewness)亦称偏态、偏态系数。 表征概率分布密度曲线相对于平均值不对称程度的特征数。直观看来就是密度函数曲线尾部的相对长度。 定义上偏度是样本的三阶标准化矩: skew(X)=E[(X−μσ)3](1)skew(X)=E[(\frac{X-\mu}{\sigma})^3]......原创 2017-11-21 12:54:12 · 35374 阅读 · 0 评论 -
pandas之get_dummies
方法pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False)该方法可以讲类别变量转换成新增的虚拟变量/指示变量。常用参数 data : array-like, Series, or DataFrame 输入的数据原创 2017-11-26 09:54:03 · 25853 阅读 · 1 评论