
数据处理
格林黄
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
四分位数和箱线图
四分位数 四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。 箱线图 利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法。 四分位差:IQR = Q3-Q1,IQR(interquartile range) 异常值:OUTLIER<Q1-1.5IQR or OUT...原创 2019-10-28 18:39:20 · 3728 阅读 · 0 评论 -
数据处理-处理缺失值、去除空格值、数据分组、虚拟变量
查看缺失值 dataframe.isnull( ) 填补缺失值 向上填充法 .ffill( ) 向下填充法 .bfill( ) 将某个特定的值x填充空白值 .fillna(x) 删除含有缺失值的样本 .dropna( ) trips1.csv start_id,end_id,start_date 0,55,55,'8/29/2013 14:13' 1,55,55,'8/...原创 2019-10-21 12:36:10 · 1521 阅读 · 0 评论