
统计
euler1983
Focus on Computer vision algorithms, medical imaging and AR.
展开
-
存在分类变量时分别利用SPSS和python做多元线性回归
1. SPSS当存在分类变量时,需要首先处理成多个哑变量,例如将年龄分成三个:age<18, age18_60, age>60。然后在SPSS里纳入除了ref的所有哑变量,例如我们要将18-60作为参考组,就纳入age<18和age>60,不要纳入age18-60。首先可以选择stepwise进行特征筛选建模。但是勾选逐步后,不能enable Bootstrap...原创 2020-05-07 17:26:02 · 7294 阅读 · 0 评论 -
python里的分类模型
python里有两个包可以做分类模型,一个是sm.logit,另外一个是sklearn里的logisticRegression。sm.logit能给出p value,但只针对于二分类。logisticRegression可以做多分类,但是不能给出p value要想做多分类且有p value的,只能用SPSS的有序多分类了?...原创 2020-05-07 10:11:09 · 736 阅读 · 0 评论 -
评价回归模型的一个新指标:CCC系数
之前常用来评价回归模型的指标会选取MSE, RMSE这一类。但是这一类的指标问题在于难以直观对应到对拟合效果的解释。特别是有时候如果真实值挺大的时候,RMSE也会很大,更无法直观评价模型的优劣了。而CCC系数(ConcordanceCorrelationCoefficien)可以克服此类问题。CCC系数能够拆分成三个成分:1. pearson系数,用于评价拟合的线性程度。...原创 2020-03-29 10:40:18 · 7905 阅读 · 4 评论 -
两变量的一致性评分
1. 对两个分类变量,用kappa评分。2. 对两个等级变量,用kendall一致性系数。3. 对两个连续变量,用Concordance correlation coefficient(CCC)系数。原创 2020-03-27 21:53:54 · 1482 阅读 · 0 评论 -
TableOne中的非参检验
python中的TableOne库中用的非参检验是KW方法。而stats库中常用的是一种非参是Mann-Whitney U检验:statistic,pval = stats.mannwhitneyu(x,y)这两组有什么区别呢?答:Kurskal-Wallis检验是Wilcoxon方法(其实是Mann-Whitney检验)用于多于两个样本的时候的升级版。当对两个样本...原创 2020-03-26 18:31:25 · 953 阅读 · 0 评论 -
什么是独立相关危险因素?
独立危险因素的概念在做Logistic回归分析时,OR大于1称为危险因素,小于1称为保护因素。而独立危险因素一般指经过单因素分析后有意义的因素,进一步进行多因素分析确定,筛选出来的有意义变量才成为独立危险因素。独立预后因素同理。可以简单地理解“独立”为:该因素单独分析时是有统计学意义的影响因素并且与其他因素一起分析时依旧具有统计学意义(即不受其他因素的影响)。非独立的情况...原创 2020-03-16 17:33:53 · 36353 阅读 · 0 评论 -
tableone比较两组数据时各个组的均值方差均相同
今天用table比较两个组的差异,数据是用两个dataframe竖向拼接起来的。然后用table进行检验:columns = ['diff', 'label']categorical = []nonnormal = []groupby = 'label'mytable = TableOne(val_stats, columns, categorical, groupby, non...原创 2020-01-31 15:03:38 · 1221 阅读 · 0 评论 -
假设检验的类型
数值变量 分类变量 正态分布 t-test 卡方 偏态分布 rank-sum Fisher rank-sum:秩和rank:秩序的意思,rank-sum就是秩序的和KW是比较常见的一类rank-sum秩和检验方法,尤其适用于多个组之间比较。...原创 2019-08-13 12:51:04 · 3221 阅读 · 0 评论