回归分析入门:R语言环境与工具介绍
1. 回归分析中的变量处理
在回归分析里,对于二分解释变量(取值为0或1),可直接进行回归,因为该变量本身就关联着两个数值。而对于具有多个取值的分类解释变量,在用于回归分析前,需将其转换为只有两个水平(如0和1)的变量,这一过程被称作虚拟编码或使用指示变量。若响应变量为二分变量,则应采用逻辑回归。
2. R语言环境概述
2.1 R语言简介
R是一种解释型编程语言,它支持使用常见的信息控制工具,借助大量函数实现模块化编程。大部分可用功能都是用R语言编写的,用户还能与用C、C++或FORTRAN编写的程序进行交互。
R是一个受S语言启发的GNU项目,与S语言相似,可视为S语言的不同实现。它由John Chambers及其在贝尔实验室的同事开发。虽然R和S存在一些显著差异,但大量为S语言编写的代码在R环境中也能直接运行。R以自由软件的形式提供,遵循自由软件基金会(FSF)的GNU通用公共许可证(GPL),可获取其源代码。
2.2 R语言的特点与优势
R是一个集成计算系统,具备以下功能:
- 指定一组命令并执行。
- 以文本格式查看结果。
- 在辅助窗口中查看图表。
- 访问外部存档,包括基于网络的存档,以获取文档、数据和图表。
- 永久存储结果和/或图形。
R语言之所以实用且受用户青睐,是因为随着时间推移,统计学家、工程师和科学家们开发了大量以包形式组织的脚本。用R编写的包能够添加高级算法、纹理彩色图形和数据挖掘技术,从而更好地分析数据库中的信息。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



