R语言之data.frame

本文深入探讨了数据框(DataFrame)这一数据结构,将其视为从向量到矩阵的进化,特别强调了数据框如何在存储多样化的数据类型和进行高效数据操作方面提供优势。通过实例展示了如何创建数据框、访问元素以及利用其功能进行数据处理。同时介绍了数据框与其他数据结构(如列表和矩阵)之间的区别,并提供了将数据框用于数据合并、扩展等高级应用的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. data frame之于matrix,就像list之于vector,像是一个升级版,(一行)可以存储多种类型的数据(即每一列的数据类型可以不同)
  2. data frame的创建:

    kids<-c(“Jack”,”Jill”)

    ages<-c(12,10)

    d<-data.frame(kids,ages,stringsAsFactors=FALSE)

  3. data frame创建:数据框(Data frame) 前面我们已经看到一个数据框可以由函数read.
       table 间接创建;这里也可以用函数data.frame来创建。数据框中的向
       量必须有相同的长度,如果其中有一个比其它的短,它将“循环”整数
       次(以使得其长度与其它向量相同):
    > x <- 1:4; n <- 10; M <- c(10, 35); y <- 2:4
    > data.frame(x, n)
    x n
    1 1 10
    2 2 10
    3 3 10
    4 4 10
    > data.frame(x, M)
    x M
    1 1 10
    2 2 35
    3 3 10
    4 4 35

  4. data frame中元素的创建

    1) d[[index]]

    2) d$column_name 根据列名取出所在的列,如果有na那么可以用na.omit去除na值,然后进行操作

    3) d[,index]:访问第index列

    4) d[index,]:访问第index行

    5) d[[a:b]]:访问第a列的第b个元素

    6) d[a:b]:对data frame提取a列到b列来构成子frame。

  5. 对于data frame,依然可以在[]内写表达式来做过滤
  6. 如list的可扩展性一样,data frame也可以“扩展”——通过rbind增加行,通过cbind增加列(也可以通过d$newColumn<-c(aaa,bbb)这样来添加一个名为newColumn的列)
  7. merge方法可以合并两个data frame,类似于sql中的join
  8. lapply()可以将指定的方法f()作用于data frame的各个列
转自:http://datawarehou.se/knowledge/the-art-of-r-5/ 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值