相关分析
import statsmodels.api as sm import pandas as pd import numpy as np from patsy.highlevel import dmatrices # 这个是线性回归的 from common.util.my_sqlalchemy import sqlalchemy_engine import math from scipy.stats.stats import pearsonr sql = "select Q1R3, Q1R5, Q1R6, Q1R7 from db2017091115412316222027656281_1;" df = pd.read_sql(sql, sqlalchemy_engine) df_dropna = df.dropna() result = pearsonr(df_dropna['Q1R3'], df_dropna['Q1R5']) print(result)
报告展示:
相关性检验显示,rkzzl与gmsr显著负相关(Pearson’r=-0.529,p<0.05)。
若p>0.5则写:rkzzl与gmsr无显著相关关系(Pearson’r=-0.529,p>0.05)。
|
Pearson’r |
p |
|
-0.5292 |
0.0425 |