《实用机器学习》(孙亮 黄倩.著)笔记——第二章 R语言

本文是《实用机器学习》第二章的笔记,主要介绍了R语言的简单介绍、初步体验、基本语法、常用数据结构,包括向量、因子、矩阵和数据框,以及列表。内容涵盖R的下载安装、注释、表达式、函数调用、控制语句、自定义函数,以及向量、因子、矩阵的运算和数据框的操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2.1R的简单 介绍
一、R是一种自由、免费、开源的解释型编程语言,具有强大的数据分析工具和图形工具,支持多种设备上的分析和展示。

S语言无须关心内存分配与数据结构细节,具有良好的可移植性与可扩展性。

2.2R的初步体验
一、R的下载与安装:
https://blog.youkuaiyun.com/m0_47397401/article/details/106070026

二、RStudio下载与安装:
https://blog.youkuaiyun.com/m0_47397401/article/details/106070609

2.3基本语法
R语言允许直接使用变量,不需要预定义数据类型

一、注释语句
以字符#开头的语句称为注释语句。注释内容占多行时,每行前面都要加上#。在RStudio中,可以使用快捷键Ctrl+Shift+C注释一块程序,也可以使用Ctrl+Shift+C去除注释。

二、表达式语句
1、在R中,所有的变量、数据及函数都以对象的形式保存在内存中。对象的名字必须以字母开头,中间可以包含点(.)及下划线(_)。

2、赋值功能:=、->、-<
在这里插入图片描述
3、加、减、乘、除、乘方、取模、整数除法:+,-,*,/,^,%%,%/%
在这里插入图片描述
4、+号也可以用作连字符
在这里插入图片描述
5、大于、小于、大于等于、小于等于、等于、不等于:>,<,>=,<=,==,!=

6、字符型数据可以用单引号或者双引号表示
在这里插入图片描述
7、与、或、非:&,|,!

8、a %in% b,可判断a是否在b中间

三、函数调用语句
函数调用语句的一般形式为:
函数名(实际参数1,实际参数2,……)

四、控制语句
在这里插入图片描述
在这里插入图片描述
五、函数
ls():列出内存中的所有对象名

help():获取关于函数的进一步介绍信息

rm()/remove():删除内存中的所有对象

paste():将多个字符型对象串起来
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
paste0():sep为空字符

cat():以用户自定义的形式输出结果

plot():作图画出y相对于x的变化情况

c():把若干个参数组合成一个向量或者列表,函数的返回值即为组合的结果

六、自定义函数:
R语言允许如下形式的自定义函数:
在这里插入图片描述
采用超级赋值**<<**可以使r从局部变量变为全局变量
在这里插入图片描述

2.4常用数据结构
2.4.1向量
一、向量和基础数据类型
R中的基本类型是向量,而不是标量

根据存储元素类型的不同,向量可以分为如下几类:
整数型、数值型、字符型、逻辑型、复数型

在这里插入图片描述
assign函数可替换为<-,可以使用**class()**函数来检查生成这4个向量的类型
在这里插入图片描述
在R中,逻辑值的表示为TRUE和FLASE,也可以简写为T和F。

seq():生成序列
在这里插入图片描述
rep():生成一个所有元素都相同的向量
在这里插入图片描述
或者使用如下函数,效果完全相同
在这里插入图片描述

常用的类型转换函数有:
在这里插入图片描述
在R中,无论数据类型如何,缺省值都用NA表示,进行任何操作所得的结果都是NA。对于NA值,一般使用is.na()来处理。
在这里插入图片描述

二、向量的运算
在这里插入图片描述
在这里插入图片描述

2.4.2因子
在R中,因子是用来表示分类变量的一种有效方法,所谓分类变量就是取值来自一个集合的变量

因子数据:如果将每个元素都存储为字符型数据,则会占用比较多的存储空间。为节省存储空间,可以用正整数的形式保存每个元素,并保存正整数到各个取值之间的映射关系。这样得到的数据就是因子数据,而所有不同的取值称为水平

在这里插入图片描述
将gender转化为因子数据
在这里插入图片描述
在这里插入图片描述
levels():获取所有水平值

2.4.3矩阵
一、矩阵的定义
在这里插入图片描述
在这里插入图片描述
array()matrix():获得矩阵
在这里插入图片描述
colnames(M):获取和修改M的列名
rownames(M):获取和修改M的行名

二、矩阵的运算
1、基本运算
矩阵乘积:A %*% B
在这里插入图片描述
输出:
在这里插入图片描述
solve():求解逆矩阵
在这里插入图片描述
在这里插入图片描述

2.4.4数据框
一、数据框的定义
数据框是R语言中最接近SAS和SPSSS数据集的数据结构,它在形式上类似于矩阵,但允许各列的数据类型不同,可以很方便地表示实际中的各种数据。

创建数据框的方法:
1、通过读取文件的方式创建数据框
2、手工创建数据框

二、 数据框的操作
rbind(dfa,dfb):按dfa中的列顺序依次捆绑dfa和dfb的行,生成一个新的数据框
cbind(dfa,dfb):按dfa中的行顺序依次捆绑dfa和dfb的行,生成一个新的数据框

expand.grid():将参数的不同组合保存在一个数据框中

2.4.5列表
R的列表是一个由对象的有序集合构成的对象。列表中包含的对象又称为它的分量。列表中的分量可以为任意类型,包括列表。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值