《实用机器学习》（孙亮黄倩.著）笔记——第二章 R语言_r语言中注释语句以什么开头-优快云博客

本文链接：https://blog.youkuaiyun.com/m0_47397401/article/details/106062912

本文是《实用机器学习》第二章的笔记，主要介绍了R语言的简单介绍、初步体验、基本语法、常用数据结构，包括向量、因子、矩阵和数据框，以及列表。内容涵盖R的下载安装、注释、表达式、函数调用、控制语句、自定义函数，以及向量、因子、矩阵的运算和数据框的操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2.1R的简单介绍
一、R是一种自由、免费、开源的解释型编程语言，具有强大的数据分析工具和图形工具，支持多种设备上的分析和展示。

S语言无须关心内存分配与数据结构细节，具有良好的可移植性与可扩展性。

2.2R的初步体验
一、R的下载与安装：
https://blog.youkuaiyun.com/m0_47397401/article/details/106070026

二、RStudio下载与安装：
https://blog.youkuaiyun.com/m0_47397401/article/details/106070609

2.3基本语法
R语言允许直接使用变量，不需要预定义数据类型

一、注释语句
以字符#开头的语句称为注释语句。注释内容占多行时，每行前面都要加上#。在RStudio中，可以使用快捷键Ctrl+Shift+C注释一块程序，也可以使用Ctrl+Shift+C去除注释。

二、表达式语句
1、在R中，所有的变量、数据及函数都以对象的形式保存在内存中。对象的名字必须以字母开头，中间可以包含点（.）及下划线（_）。

2、赋值功能：=、->、-<
在这里插入图片描述
3、加、减、乘、除、乘方、取模、整数除法：+，-，*，/，^，%%，%/%

4、+号也可以用作连字符

5、大于、小于、大于等于、小于等于、等于、不等于：>，<，>=，<=，==，!=

6、字符型数据可以用单引号或者双引号表示
在这里插入图片描述
7、与、或、非：&，|，!

8、a %in% b，可判断a是否在b中间

三、函数调用语句
函数调用语句的一般形式为：
函数名（实际参数1，实际参数2，……）

四、控制语句
在这里插入图片描述

五、函数
ls()：列出内存中的所有对象名

help()：获取关于函数的进一步介绍信息

rm()/remove()：删除内存中的所有对象

paste()：将多个字符型对象串起来
在这里插入图片描述

paste0()：sep为空字符

cat()：以用户自定义的形式输出结果

plot()：作图画出y相对于x的变化情况

c()：把若干个参数组合成一个向量或者列表，函数的返回值即为组合的结果

六、自定义函数：
R语言允许如下形式的自定义函数：
在这里插入图片描述
采用超级赋值**<<**可以使r从局部变量变为全局变量

2.4常用数据结构
2.4.1向量
一、向量和基础数据类型
R中的基本类型是向量，而不是标量

根据存储元素类型的不同，向量可以分为如下几类：
整数型、数值型、字符型、逻辑型、复数型

在这里插入图片描述
assign函数可替换为<-，可以使用**class()**函数来检查生成这4个向量的类型

在R中，逻辑值的表示为TRUE和FLASE，也可以简写为T和F。

seq()：生成序列
在这里插入图片描述
rep()：生成一个所有元素都相同的向量

或者使用如下函数，效果完全相同

常用的类型转换函数有：
在这里插入图片描述
在R中，无论数据类型如何，缺省值都用NA表示，进行任何操作所得的结果都是NA。对于NA值，一般使用is.na()来处理。

二、向量的运算
在这里插入图片描述

2.4.2因子
在R中，因子是用来表示分类变量的一种有效方法，所谓分类变量就是取值来自一个集合的变量

因子数据：如果将每个元素都存储为字符型数据，则会占用比较多的存储空间。为节省存储空间，可以用正整数的形式保存每个元素，并保存正整数到各个取值之间的映射关系。这样得到的数据就是因子数据，而所有不同的取值称为水平

在这里插入图片描述
将gender转化为因子数据

levels()：获取所有水平值

2.4.3矩阵
一、矩阵的定义
在这里插入图片描述

array()：matrix()：获得矩阵

colnames(M)：获取和修改M的列名
rownames(M)：获取和修改M的行名

二、矩阵的运算
1、基本运算
矩阵乘积：A %*% B
在这里插入图片描述
输出：

solve():求解逆矩阵

2.4.4数据框
一、数据框的定义
数据框是R语言中最接近SAS和SPSSS数据集的数据结构，它在形式上类似于矩阵，但允许各列的数据类型不同，可以很方便地表示实际中的各种数据。

创建数据框的方法：
1、通过读取文件的方式创建数据框
2、手工创建数据框

二、数据框的操作
rbind(dfa,dfb)：按dfa中的列顺序依次捆绑dfa和dfb的行，生成一个新的数据框
cbind(dfa,dfb)：按dfa中的行顺序依次捆绑dfa和dfb的行，生成一个新的数据框

expand.grid()：将参数的不同组合保存在一个数据框中

2.4.5列表
R的列表是一个由对象的有序集合构成的对象。列表中包含的对象又称为它的分量。列表中的分量可以为任意类型，包括列表。

《实用机器学习》（孙亮 黄倩.著）笔记——第二章 R语言