
R
文章平均质量分 77
搁浅时光0315
这个作者很懒,什么都没留下…
展开
-
R语言数据筛选、汇总、重构
最近学习的知识点总结如下:3.1 去掉多余的数据原创 2018-05-24 16:36:03 · 47231 阅读 · 1 评论 -
R语言和sql server相连
我这里考虑用odbc和jdbc的方式进行连接。1.odbc:开放数据库连接(Open Database Connectivity,ODBC)是为解决异构数据库间的数据共享而产生的,现已成为WOSA(The Windows Open System Architecture ),Windows开放系统体系结构)的主要部分和基于Windows环境的一种数据库访问接口标准ODBC 为异构数据库访问提供统一...原创 2018-05-24 20:57:24 · 3149 阅读 · 0 评论 -
向R中导入数据
library(RODBC) myconn<-odbcConnect("v5",uid="sa",pwd="123456")data<-sqlQuery(myconn,"select * from [****] where ****")close(myconn);1.通过odbc数据源导入ms sql数据,这需要提前设置odbc数据源,具体参考博客点击打开链接2.csv文件通...原创 2018-05-24 20:58:22 · 2293 阅读 · 0 评论 -
R建模之回归(一)
3种常见的回归模型:线性回归(预测连续型变量比如婴儿出生体重),逻辑回归(预测二元变量比如过低出生体重与正常出生体重),泊松分布(计数比如每年或每个国家过低出生体重婴儿人数)我们以gamlss.data包提供的usair数据集进行研究,US空气污染数据集。我们希望预测根据城市面积(以人口规模/千人为统计依据)估计的空气污染程度(这里也就是数据集中的x3),空气污染以每立方米空气中二氧化硫的含量(毫...原创 2018-05-30 18:29:37 · 2414 阅读 · 0 评论 -
R建模之回归(二)
第一节是建立线性回归模型以及对于其模型预测效果的讨论,这一节做一下模型中引入一个离散型预测变量。依然使用上一节中的usair数据集,在模型中增加x5(降水量:年度发生降雨的天数)作为预测变量,该预测变量有三种类别(低、中、高),将他们的分界点划分为30天和45天,研究降水量和so2浓度是否存在关联,模型建立如下所示:plot(y~x5,data=usair,cex.lab=1.5) ...原创 2018-05-30 18:29:03 · 1083 阅读 · 0 评论