数据分析
文章平均质量分 80
分享一些处理数据的方法和工具。
Hello! The world。
为这个世界做点什么吧!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
相关系数简记
pearson和spearman相关系数食用方法: 1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,效率没有pearson相关系数高。 2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。 3.两个定序测量数据之间也用spearman相关系数,不能用pearson相关系数。 但是 上述二者只能观察是否线性相关。而互信息发可以观察非线性相关。 互信息: Pearson和spearman相关系数存在一个问题是一般情况下只考原创 2021-02-10 11:51:44 · 550 阅读 · 0 评论 -
DataFrame的bool索引:根据子DataFrame的某一列拆分父DataFrame。
有DataFrame数据: train, test;作如下操作(主要是方法一): ```python combine = train.append(test) # 做一系列数据预处理... # 处理完之后,如何分离train和test? # 方法一、找一个能唯一区分train和test的列;比如id: x_train = combine[combine['id'].isin(train['id'])] x_test = combine[combine['id'].isin(test['id'])] #原创 2020-12-25 12:50:12 · 341 阅读 · 0 评论
分享