R语言数据分析系列之一

最新推荐文章于 2023-01-09 12:09:55 发布

原创最新推荐文章于 2023-01-09 12:09:55 发布 · 3.5k 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#数据分析 #r语言 #数据挖掘

数据挖掘同时被 2 个专栏收录

11 篇文章

订阅专栏

9 篇文章

订阅专栏

R语言数据分析系列之一

—— by comaple.zhang

写在前面：关于R的优势网上已经很多了，略去不表，这里只表干货。

这是我第一篇关于R的博客，打算写个系列教程，带领你一步一步进入R的神奇世界，最后用一个例子做实战讲解，希望能够分享给您，也为您的工作带来某些益处，您的支持是我的动力，谢谢。

数据类型

numeric 数值型

> x <- c(1:10)

> x

[1] 1 2 3 4 5 6 7 8 9 10

> mode(x)

[1] "numeric"

complex 复数类型

> x <- 100 +1i

> x

[1] 100+1i

> mode(x)

[1] "complex"

logical 逻辑型

> x <- c(sample(1:10,5))

> x

[1]  2  3  8  7 10

> x <- x==3

> x

[1] FALSE  TRUE FALSE FALSE FALSE

> mode(x)

[1] "logical"

第一行用采样的方式随机创建一个向量，并用来判断该项量与3的值是否相等，结果赋值给x

character 字符型

> x <- 'comaple.zhang'

> x

[1] "comaple.zhang"

> mode(x)

[1] "character"

> nchar(x)

[1] 13

factor 因子型

> x <- sample(1:5,10,replace=T)

> x

[1] 2 4 4 4 4 1 5 4 1 2

> x <- as.factor(x)

> x

[1] 2 4 4 4 4 1 5 4 1 2

Levels: 1 2 4 5

因子类型很有用， 其中的levels代表着你的因子的水平，即：去重以后的类别。在你处理数据集分类的时候就方便多了。当你改变你的因子level的时候，你会发现你的数据其实也跟着改变了如下：

> levels(x)

[1] "1" "2" "4" "5"

> levels(x)[3] <- 't'

> x

[1] 2 t t t t 1 5 t 1 2

Levels: 1 2 t 5

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

康派尔

关注关注

5
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

分类变量的统计情况分析（使用R语言）

ScriptCharm的博客

08-26

587

通过以上的R代码，我们可以很方便地进行分类变量的统计情况分析。使用table()函数可以得到频数统计，prop.table()函数可以计算相对频率，cumsum()函数可以计算累计频率。通过数据框和图表的结合使用，可以更全面地了解和呈现分类变量的统计情况。相对频率是每个类别的频数除以总样本数，而累计频率是每个类别的频数累加起来除以总样本数。一般来说，我们会对分类变量的频数进行统计，以了解每个类别的出现次数。除了频数和频率统计，我们还可以使用图表来可视化分类变量的统计情况。常见的图表类型包括饼图和柱状图。

深度学习R语言 mlr3 建模，训练，预测，评估（随机森林，Logistic Regression）

RookieTrevor的博客

06-26

1万+

深度学习R语言 mlr3 建模，训练，预测，评估（随机森林，Logistic Regression）本文主要通过使用mlr3包来训练German credit数据集，实现不同的深度学习模型。 1. 加载R使用环境 # 安装官方包，一般情况下大部分常用的包都可以官方安装 # install.packages("tidyverse") # install.packages("bruceR") # # # 安装Github来源的包 # # 先安装devtools包后才可以安装github来源的包 # # i

参与评论您还未登录，请先登录后发表或查看评论

R语言——数据分析

qq_47897078的博客

11-16

6990

R语言——什么是数据分析 数据数据：是指对客观事件进行记录并可以鉴别的符号，是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符合的组合为什么要做数据分析 我们可以通过数据分析的结果来指导决策 数据分析的过程数据采集---->数据存储---->数据分析---->数据挖掘---->数据可视化---->进行决策 1.数据采集了解数据采集的意义在于真正了解数据的原始面貌，包括数据产生的时间、条件、格式、内容、长度、限制条件等。这会帮助数据分析师更有针对性的控制

《R语言数据挖掘》读书笔记：八、流数据分析与挖掘

Nelson_hehe的博客

09-28

562

第八章、流数据、时间序列数据和序列数据挖掘 流数据、时间序列、和序列数据的特征是与众不同的，即数据量大且无尽的。他们数据量太大不能获得精确的结果，这意味着将得到一个近似的结果。因此，应该扩展经典的数据挖掘算法或者为这类型数据集设计一种新的算法。 1.信用卡交易数据流和STREAM算法一种数据源总是需要多种预定义的算法或者一种全新的算法来处理。流数据的行为与传统数据集有些不同...

R语言与数据分析之三：分类算法2

OR家园-howard

12-09

5453

上期与大家分享的传统分类算法都是建立在判别函数的基础上，通过判别函数值来确定目标样本所属的分类，这类算法有个最基本的假设：线性假设。今天继续和大家分享下比较现代的分类算法：决策树和神经网络。这两个算法都来源于人工智能和机器学习学科。首先和小伙伴介绍下数据挖掘领域比较经典的Knn（nearest neighbor）算法（最近邻算法）算法基本思想： Step1：计算出待测样本与学习集中所有点

r语言数据分析案例.zip

09-05

R语言数据分析案例 R语言是一种专门用于统计分析和图形表示的编程语言和软件环境。自1993年诞生以来，R语言在学术界和工业界得到了广泛的应用，特别是在生物统计、金融分析、数据挖掘等领域。R语言具有强大的数据...

R语言在森林数据分析中的应用

最新发布

11-19

R语言的可视化功能也是其在森林数据分析中不可忽视的优势之一。作者详细讲解了如何使用R语言创建直观的图表和图形，这对于数据分析的解释和交流至关重要。在现代林业研究和管理中，数据可视化不仅帮助研究者快速把握...

精选资源

R语言数据分析学习资料.zip

09-05

R语言数据分析学习资料一般包含了R语言的基础知识和应用实例，帮助学习者从零开始掌握R语言的数据处理能力。首先，基础学习资料会介绍R语言的基本语法，包括变量的创建、数据类型、函数的使用、条件控制、循环结构等...

精选资源

R语言数据分析案例.rar

05-14

这些包极大地丰富了R语言的数据处理能力，使得它成为现代数据分析的首选工具之一。文档"R语言数据分析案例.docx"可能包含了以下内容：首先，案例可能会从数据导入开始，介绍如何使用`readr`或`data.table`等包读取...

用R语言进行数据分析入门教程（一）

01-04

《R语言数据分析入门详解》 R语言，一种强大的统计计算和数据可视化工具，因其丰富的统计功能和开源特性，在数据分析和机器学习领域广受欢迎。本文将引导初学者逐步掌握使用R语言进行数据分析的基本流程。首先，...

数据分析工具-R必读物

12-10

本资源包含R语言从入门-初级-中级的资料，可以很好的指导读者了解并熟悉这个工具。

CHAP7:使用 R 编程进行数据分析

weixin_39999502的博客

09-18

1727

利用R对数据进行处理、分析、可视化、写报告。

基于R语言分析自带数据集heart

m0_65221523的博客

01-09

8470

通过Logistic模型、决策树、随机森林分析R语言自带heart数据集并得出结论

R语言矩阵的基础运算

weixin_45072139的博客

09-06

2088

R语言矩阵的基础运算创建矩阵矩阵合并矩阵删除矩阵进阶计算创建矩阵先创建一个2*5的矩阵a > x<-c(1:10) > a<-matrix(x,ncol=2,nrow=5,byrow=T) > a [,1] [,2] [1,] 1 2 [2,] 3 4 [3,] 5 6 [4,] 7 8 [5,] ...

手把手教你一整套R语言数据分析+建模流程

zhaotian151的博客

06-28

4万+

近期帮公司整理数据分析流程，找到了之前写的一篇代码，分享给大家。这是我上学时候做的一个项目，当时由于经验不足产生了一些问题，这些问题会在之后一点一点给大家讨论，避免各位踩坑。本篇分享会带一些讲解，可能有些地方不够清楚，欢迎留言讨论。本次除了分享之外也是对自己之前项目的一个复盘。还是使用R语言（毕竟是我钟爱的语言）。

R数据分析：冲击流图与热图的做法以及多图布局

Codewar的博客

12-14

642

python---post请求时其中dict中套有json

Mojitoice的博客

08-05

708

在写自动化测试脚本的时候，遇到了一个问题，我定义了一个dict作为该请求的参数，在该dict中其中一个键的值为json字符串。然后我就凌乱了。以下是我搞出来的结果，在此做个记录，以后遇到这个问题可以少费劲些。 #要求就是这个样子的： dict = { "username":"kk", "extra":"此处是个json字符串", } 然鹅，如果我直接添加一个{"jso...

R语言 c()函数官方说明文档