网址:http://www.sxdyc.com/lasso
一、简介
在最小二乘基础上增加了一个惩罚项来对估计参数进行压缩,当参数缩小到小于一个阈值的时候,就令它变为0,从而选择出对因变量影响较大的自变量并计算出相应的回归系数,最终能得到一个比较精简的模型。
基于glmnet包进行lasso分析,进一步压缩基因数量
二、使用方法
1、数据准备
第一个文件:行为基因,列为样本的表达谱矩阵,其实第一列不能重名;
第二个文件:生存数据;第一列为样本名,第二列为生存时间(可以是天/月/年),第三列为生存状态
第三个文件:进行lasso分析的基因
2、直接提交等待运行即可,默认是使用10倍交叉
三、结果
运行完成后即可下载
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析