python进行数据分析------相关分析

本文通过Python中的statsmodels和pandas库进行数据相关性分析。利用Pearson相关系数检验了两组数据之间的相关性,并展示了如何从数据库中读取数据、处理缺失值以及执行相关性检验的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

相关分析

import statsmodels.api as sm
import pandas as pd
import numpy as np
from patsy.highlevel import dmatrices # 这个是线性回归的
from common.util.my_sqlalchemy import sqlalchemy_engine
import math

from scipy.stats.stats import pearsonr


sql = "select Q1R3, Q1R5, Q1R6, Q1R7 from db2017091115412316222027656281_1;"
df = pd.read_sql(sql, sqlalchemy_engine)
df_dropna = df.dropna()

result = pearsonr(df_dropna['Q1R3'], df_dropna['Q1R5'])
print(result)

 

报告展示:

相关性检验显示,rkzzlgmsr显著负相关(Pearson’r=-0.529,p<0.05)。

p>0.5则写:rkzzlgmsr无显著相关关系(Pearson’r=-0.529,p>0.05)。

 


Pearson’r

p


-0.5292

0.0425

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值