
ISLR
43118
JonyChan技术学习过程中的总结
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
(ISLR)关于统计学习面试可能会问到的知识点
1.什么是统计学习统计学习是基于数据构建概率模型,并运用模型对数据进行预测与分析。2.衡量预测函数在何种程度接近观测值,用均方误差MSE3.如何估计f分为两类方法:参数方法 和 非参数方法。参数方法: 一般用在回归问题先 对函数f的形式事先做明确的假设,并选择模型,最常用的是参数模型;再 用最小二乘法 拟合参数非参数法: 一般用在分类问题相较于参数法,需要较多的观测数据4.欠拟合与过拟合:欠拟合:原因:模型过于简单,例如对于非线性的数据,用线性的模型去拟合。结论:欠拟合原创 2020-05-12 16:37:42 · 528 阅读 · 0 评论 -
Pycharm运行R脚本画图时无法显示中文字符
解决方法:仅需添加语句:par(family=“STXihei”) 即可原创 2020-04-15 21:51:08 · 694 阅读 · 0 评论 -
(ISLR)Experience4:逻辑斯蒂回归、LDA、QDA和KNN
1.逻辑斯蒂回归library(ISLR)attach(Smarket)glm.fit <- glm(Direction~Lag1 + Lag2 + Lag3 + Lag4 + Lag5 + Volume, data = Smarket,family = binomial) #family = binomial 说明glm()执行逻辑斯蒂回归train <- (Year...原创 2020-03-03 12:22:31 · 1022 阅读 · 0 评论 -
(ISLR)2019-nCov新增人数预测模型
Title : TODOObjective : TODOCreated by: chenjunyiCreated on: 2020/2/11#Feb_11#截止至昨日24:00 的感染人数par(family=“STXihei”)Today_confirmedNum <- c( #截至于Feb_1144742,42744, 40224, 37162,34594, 3...原创 2020-05-21 15:20:27 · 268 阅读 · 0 评论 -
(R-note)R笔记
转自:https://blog.youkuaiyun.com/kMD8d5R/article/details/818441261.图像标题原创 2020-02-12 10:46:17 · 382 阅读 · 0 评论 -
(ISLR-note)Chapter3-Experience:高级多元线性回归
一、交互项① 语句lstat : black —— 将lstat和black的交互项lstat x age纳入模型② 语句lstat * age —— 将lstat,age和交互项lstat x age同时作为预测变量(即lstat * age = lstat + age + lstat x age)二、预测变量的非线性变换1.创建非一次变量: I(),如 I(X^2)2.量化乙模...原创 2020-02-10 10:48:31 · 292 阅读 · 0 评论 -
(ISLR-note)R语言如何导入数据文件
1.导入.csv文件csv_1 <- read.csv("/Users/*******/Desktop/Graduation thesis/test/test_Boston_CSV.csv")2.导入.xlsx文件①安装readxl库函数install.packages(“readxl”)②引入readxl库函数library(readxl)③读取文件的具体路径...原创 2020-01-18 21:25:51 · 1327 阅读 · 0 评论 -
(ISLR-note)Chapter5 重抽样方法
一、交叉验证法1.验证集方法将数据分为 训练集 和 验证集。2.留一交叉验证法LOOCV①将一个单独的观测(x1,y1)作为验证集,剩下的观测 {(x2,y2), (x3,y3), … , (xn, yn)}组成训练集。然后在n-1个训练观测上拟合统计学习方法,再对余下的观测根据它的值x1来做yih。MSE1 = (y1 - y1h)^2提供了对于测试误差的一个渐进无偏估计。②重复这个步...原创 2020-01-16 23:14:30 · 231 阅读 · 0 评论 -
(ISLR-note)Chapter3-3回归模型中的其他注意事项
线性模型的扩展1.两个概念:可加性与线性性①可加性:可加性是指预测变量Xj的变化对响应变量Y产生的影响与其他预测变量的取指无关。线性假设是指无论Xj取何值, Xj变化一个单位引起的响应变量Y的变化是恒定的。②线性关系:响应变量跟预测变量未必是线性,有时是多项式回归2.去除可加性假设注意到:当TV或radio其中之一较低时,真实sales总是低于线性模型的预测。但当两种媒体共...原创 2020-01-16 15:47:41 · 446 阅读 · 0 评论 -
(ISLR-note)Chapter3-2多元线性回归
多元线性回归1.估计系数(estimating coefficient)选择Beta0,Beta1使残差平方和最小。Bj 解释为在所有其他预测变量保持不变的情况下,Xj增加一个单位对Y产生的平均效果。“在将温度变量纳入模型之后,同时用冰激凌销量和温度对鲨鱼攻击量建立多元回归模型,与直觉相符的结论才能产生出来,冰激凌销量这一预测变量变得不再显著”————解释了多元线性回归优于简单线...原创 2020-01-11 17:15:27 · 259 阅读 · 0 评论 -
(ISLR-note)Chapter3-1简单线性回归
1.估计系数(estimating coefficient)2.残差平方和(residual sum of squares) RSS = e1^2 + e2^2 + ... + en^2 =(y1-Beta0-Beta1*x1)^2 + (y2-Beta0-Beta1*x2)^2 + ... + (yn-Beta0-Beta1*xn)^23.样本均值(sample me...原创 2020-01-09 22:42:51 · 762 阅读 · 0 评论 -
(ISLR-note)Chapter2
1.预测与推断预测:fhead是黑箱子推断:fhead是具体函数无论是用于预测,还是用于推断,更精确的仍然是在欠光滑度的模型上取得的,也许会貌似违反直觉,然而这正是其高抗光滑模型过拟合缺陷的能力所在。2.最小二乘法拟合(多元)线性模型的方法叫最小二乘法,它是拟合线性模型最流行的方法,其光滑度较低,但模型解释性较强。补:①第6章讨论的lasso回归方法,在线性模型基础上建模,但其估计系...原创 2020-01-09 20:25:00 · 262 阅读 · 0 评论 -
(ISLR-note)Chapter2&3-Experience
1.载入库函数library(MASS)library(ISLR)2.简单回归lm.fit = lm(response~predictor, data = DATASET)attach(DATASET)lm.fit = lm(response~predictor)②查找置信区间 confidence()③predict()函数可以计算置信区间和预测区间 predict(l...原创 2020-01-09 16:00:02 · 442 阅读 · 0 评论