
R 数据科学
文章平均质量分 79
R 数据科学的原理、实例以及相关package的用法
Skye‘s Blog
R/python 的数据分析,人工智能等 技能增进中......
展开
-
在Jupyter lab中安装R packages(Anaconda的环境下)
在Jupyter lab中安装了R 环境之后会发现,有很多packages没有安装。第一种安装方式:conda …在terminal 中输入 conda install package_name,例如,要安装 python 的 numpy 包,请键入 conda install numpy 。R由于需要镜像环境,所以安装起来会经常出现一些问题。另外一些常用的conda命令:conda u...原创 2020-03-01 23:18:26 · 1372 阅读 · 0 评论 -
R 数据的预处理:数据集的合并
合并数据集很多情况下,数据集都不会只有一个文件,但是为了方便后续的处理和分析,在预处理的阶段就会将各个数据集进行合并。原创 2020-02-27 22:30:22 · 1120 阅读 · 0 评论 -
R 探索性分析的可视化(1)
以iris资料集为例,我们做一个简单的探索性的数据分析。目的是是为了看到各个变量的分布,以便于我们后面对于一些不平衡的变量进行处理首先要对数据集包含的内容有一个大致的了解# 查看这个数据集包含的变数,以及每个变数的数据形态。也可以用str()来查看形态head(iris) # 查看类别变数中每个种类的数量table(iris$Species)然后我们透过不同的图来来进行更全面分析...原创 2020-02-04 12:28:42 · 355 阅读 · 0 评论 -
R 数据的预处理:数据中缺失值(NA)的处理
训练一个机器学习模型,其实大量的时间是花在数据的预处理和探索性数据分析上。尤其是实际中遇到的data都不会太干净,所以花较长的时间来做数据的预处理是很有必要的。首先来建立一个简单的数据集library(mice)name = c(“Andy”,“Helly”,“Ann”,“Ketay”,“Wang”,“Liu”)country = c(“UK”,“US”,“US”,“US”,“CH”,“C...原创 2020-02-04 21:44:24 · 9675 阅读 · 0 评论 -
R 数据的预处理:删减不需要的数据
R的数据处理很常用的package“dplyr”里面select( )常被用来做数据的删减1. select( ) 的用法以mtcars数据集为例head(mtcars,3)# mpg cyl disp hp drat wt qsec vs am gear carb# Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4# Mazda RX...原创 2020-02-04 23:26:49 · 1462 阅读 · 0 评论 -
R 数据的预处理:数据的读写
比较两种写入方式 write. *(), write_()# 先简单建个数据框# 产生一组随机数,从0~1 共10^6个,共1000rowsreadFile = as.data.frame(matrix(runif(10 ^ 6 ,0,1), nrow=1000)) # 如果设定的名字不变,重复写入的时候,新档会覆盖旧档# 比较两种写法的速度write.csvsystem...原创 2020-02-05 22:52:27 · 325 阅读 · 0 评论 -
R 无监督聚类算法(1)K-means和层次聚类
首先我们要解决几个问题聚类算法主要包括哪些算法?主要包括:K-means、DBSCAN、Density Peaks聚类(局部密度聚类)、层次聚类、谱聚类。什么是无监督学习?• 无监督学习也是相对于有监督学习来说的,因为现实中遇到的大部分数据都是未标记的样本,要想通过有监督的学习就需要事先人为标注好样本标签,这个成本消耗、过程用时都很巨大,所以无监督学习就是使用无标签的样本找寻数据规律的一种...原创 2020-02-09 10:37:05 · 6582 阅读 · 1 评论