- 博客(19)
- 收藏
- 关注
原创 R语言实战(一):读、写数据文件
R语言实战:读、写数据文件原理读文件1. data01A.dat写文件原理参考R语言系统教程系列的第四篇文章读文件1. data01A.datOpen the file with txt:可以看到数据是自带列名的,因此我们知道读文件的命令的header参数要设置为T,数据间隔为多个空格,sep参数默认即可,但是要注意"# obs"对于R来说是个重要干扰,再考虑其作用只是序号罢了,因此,可以手动删去,此时数据文件如下:然后读取文件即可> xy = read.table(file = '
2020-08-01 16:25:04
896
原创 R notes (2) : predict.lm function
Predicted values based on linear model object.
2020-07-30 22:08:52
1273
原创 R notes (1): lm()
lm is used to fit linear models. It can be used to carry out regression, single stratum analysis of variance and analysis of covariance (although aov may provide a more convenient interface for these).
2020-07-27 17:16:46
480
原创 R语言系统教程(十二):R语言中与线性模型有关的函数
R语言系统教程(十二):R语言中与线性模型有关的函数12.1 基本函数12.2 提取模型信息的通用函数12.1 基本函数适应于多元线性模型的基本函数是lm(),其调用形式是lm(formula, data = data.frame)其中formula为模型公式,data.frame为数据框,返回值为线性模型结果对象,实际使用时需要赋给某个变量名,例如:fm1 = lm(y~x1+x2, data = production)适用于y关于x1和x2的多元回归模型(隐含截距项)。其更一般的声明如下:
2020-07-27 09:15:41
1532
原创 R语言系统教程(八):绘图命令
R语言的作图函数分为两类,第一类是高水平作图函数,可以自行产生图像,可以有坐标轴,以及图和坐标轴的说明文字等,而所谓低水平作图函数是指自身无法生成图形,只能在高水平作图函数的基础上,增加新的图形。
2020-07-15 22:40:05
4584
1
原创 R语言系统教程(七):数据的分布(含多种图的绘制)
数据的数字特征刻画了数据的主要特征,而要对数据的总体情况做全面的描述,就要研究数据的分布。
2020-07-11 22:51:58
23552
原创 R语言系统教程(六):描述统计量
6.1 位置的度量6.1.1 均值6.1.2 顺序统计量6.1.3 中位数6.1.4 百分位数6.2 分散程度的度量6.2.1 方差、标准差等6.2.2 极差等6.3 分布形状的度量6.3.1 偏度系数6.3.2 峰度系数...
2020-07-11 17:45:48
1797
原创 R语言系统教程(五):读、写数据文件
R语言系统教程(五):读、写数据文件5.1 读纯文本文件5.1.1 read.table()函数5.1.2 scan()函数5.2 读其它格式的数据文件5.3 链接嵌入的数据库5.4 写数据文件5.4.1 write()函数5.4.2 write.table()函数和write.csv()函数5.1 读纯文本文件5.1.1 read.table()函数read.table()是读表格形式的文件,函数声明如下:read.table(file, header = FALSE, sep = "", quo
2020-07-09 17:58:23
1050
原创 R语言系统教程(四):列表与数据框
列表是一种特别的对象集合,它的元素也由下标区分,但是各元素的类型可以是任意对象,不同元素不必是同一类型,元素本身允许是其它复杂数据类型,比如列表的一个元素也可以是列表。
2020-07-08 20:56:39
1801
原创 R语言系统教程(三):多维数组和矩阵
数组可以看成是带多个下标的类型相同的元素的集合,但是注意,尽管数学上向量可以看成一维数组,但是R中不行,因为数组一定是有维度属性的,但向量没有。
2020-06-30 12:58:25
11989
原创 R语言系统教程(二):对象和它的模式及属性,因子
R是一种基于对象的语言,R的对象通常包括了若干个元素,另外还有一些特殊的数据称为属性(attribute),并规定了一些操作,例如plot和print等,比如一个vector是一个对象,一个图形也是一个对象。R对象分为单纯(atomic)对象和复合(recursive)对象两种,atomic对象是指所有元素均为同一基本类型,如数值,字符串等,元素不再是对象;复合对象的元素可以是不同类型的对象,每个元素也是对象。
2020-06-27 14:10:01
1822
原创 R语言系统教程(一):向量及其相关操作
准备用业余时间写一些关于R语言的系统教程,主要思路上计划结合自己的使用经验,不追求更新速度,甚至可能会一小节一小节的写,但力求对R语言中涉及到的内容做系统全面的剖析,因此有时读者可能会觉得笔者很啰嗦,一些很简单的东西却要说个半天,还请大家多多谅解。
2020-06-21 15:39:02
3412
原创 Statistic Helper 开发自查帮助文档(六):使用Java调用R脚本的方法
Statistic Helper 开发自查帮助文档(六):使用Java调用自定义R脚本JRI包的安装使用JRI调用自定义R脚本JRI包的安装按照官方安装过程遇到了很多问题,参考此文章全部解决java调用R语言包(JRI方式),bug记录使用JRI调用自定义R脚本如何使用,参考此文章java通过JRI调用R自定义脚本...
2020-04-19 13:28:43
252
原创 Statistic Helper 开发自查帮助文档(五):Sliced Inverse Regression
Statistic Helper 开发自查帮助文档(五):Sliced inverse regression本次仅介绍一个内容,SIR,SIR的基本原理有点像非参里的naive density估计,是使用x的附近观察值给定回归值。我们使用在dr包中的dr()来实现。首先产生模拟数据# Simulate data set.seed(10) n <- 100 p <- 5 e...
2020-04-15 12:57:00
483
原创 Statistic Helper 开发自查帮助文档(四):Unsupervised learning
Statistic Helper 开发自查帮助文档(四):Unsupervised learning模块一:PCA模块二:ClusteringK-MeansHierarchical非监督学习指的是不使用response的前提下对数据进行分析处理。主要使用两种方法,第一种是大家耳熟能详的主成分方法,第二种是聚类方法。PCA之前降维时介绍过,但介绍不够详细,这部分会更加详细一点。聚类则引入两种聚类方...
2020-04-13 12:14:48
207
原创 Statistic Helper 开发自查帮助文档(三):Tree-based Method
Statistic Helper 开发自查帮助文档(三):Tree-based MethodClassification TreeRegression TreeBagging and Random ForestsBoosting本次介绍几种基于树的模型方法,树指的是回归树或者分类树,所介绍基于树的方法主要有bagging,rf和boosting。Classification Tree树的基本...
2020-04-07 20:10:20
320
原创 Statistic Helper 开发自查帮助文档(二):Classification
Statistic Helper 开发自查帮助文档(二):Classification模块一:Classification问题介绍模块二:Logistic Regression模块三:Linear Discriminant Analysis模块四:Quadratic Discriminant Analysis模块五:K-Nearest Neighbors模块一:Classification问题介...
2020-04-04 21:02:15
280
原创 Statistic Helper 开发自查帮助文档(一)
Statistic Helper 开发自查文档(一)前言模块一:Subset Selection默认Best subset selection可选Forward 或 Backward subset selection模块二:Ridge regression and LassoRidge regression前言辅修计算机专业毕设,突发奇想想写一个数据处理的辅助软件,初步打算自用,写完之后自用...
2020-04-02 17:20:12
366
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人