
数据分析
数据分析离不开pandas库的使用,但其知识点繁多,本栏目旨在归纳总结pandas用于处理数据的巧妙之处。
茶冻茶茶
这个作者很懒,什么都没留下…
展开
-
卡方检验——离散型特征相关性分析
import pandas as pd #导入读入数据的包from sklearn.feature_selection import SelectKBest #卡方检验->判断离散型特征是否相关from sklearn.feature_selection import chi2#读取数据data = pd.read_csv('./2013年八城市融合数据.csv',encoding='gbk')x= data[['归属感有无(0:有 1:无)','户口性质(0:农业 1:非农业)',原创 2022-05-25 10:44:31 · 3768 阅读 · 1 评论 -
pandas两列相乘
import pandas as pddf=pd.read_csv("csv.csv")df['mul']=df['num'].mul(df['sale'])print(df)''' num sale mul0 2 49 981 2 93 1862 1 78 783 2 67 1344 1 89 895 1 50 50'''原创 2020-07-30 22:22:53 · 6370 阅读 · 0 评论