R语言入门

本文介绍了R语言的基本操作,包括设置工作目录、下载安装包、常用数据处理包如ggplot2、lme4等的使用。还讲解了如何读取数据,处理因子类型、空元素以及日期格式。此外,提供了数据清洗的方法,如利用ifelse和nchar函数检查并移除异常数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

setwd()   设置工作目录


getwd()   获取当前工作目录。

install.packages()    下载包。其中dependencies(默认为FALSE)可设置为TRUE 即 安装初始安装过程所依赖的程序包

包:arm  用于构建多水平/层次回归模型的程序包

   ggplot2 :创建高质量图形的首选程序包

  glmnet:包含Lasso和elastic-net的正则化广义线性模型

  igraph:简单的图及网络分析程序,用于模拟社交网络

  lme4:提供函数用于创建线性及广义混合效应模型

  lubridate :提供方便的函数,使在R环境中处理日期更加容易

  RCurl:提供libcurl库中HTTP协议交互的R接口,用于从网络中导入原始数据

  reshape:提供一系列工具用于在R中处理,聚合以及管理数据

  RJSOIN:提供读写JSON(javaScript Object Notation)数据的函数,用于解析来自网络API的数据

  tm:提供一系列文本挖掘函数,用于处理非结构化文本数据

  XML:用于解析XML及HTML文件,以便从网络中提取结构化数据

用R去读取数据,需要注意的是,字段是如何分割的,read.*函数会把字符串转换为factor类型。如果没有表头

需要把表头的参数设置为false,防止R默认把第一行当作表头。

最后,如果有空元素,则定义空字符串为na.string。

想操作数据框,特别是从外部数据源读入时,强烈建议手工查看一下数据先。比较好用的函数是head,打印前六条数据。

注意书写R的时候,是使用“,”来分割,而不是空格。

使用names可以读取列名,写入列名,很方便。

使用as.D

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值