R语言数理统计之对单列值进行描述性分析

R语言数理统计之对某列值进行描述性分析

  1. 导入相关包
  2. 导入文件
  3. 选择所需列
  4. 对指定行进行筛选
  5. 分组计数:修改合计列名
  6. 分组摘要:最大最小平均分位数
  7. 合并连接各表
  8. 导出文件
    library(tidyverse)
    library(readxl)
    wc0 <- read_excel("wc4.xlsx", sheet = "wc0")
    wc1 <- read_excel("wc4.xlsx", sheet = "wc1")
    
    df <- select(wc1,板块名称,监测区名称,小区名称,租金单价)
    df0 <-dplyr::filter(df, 板块名称 %in% c("广埠屯板块", "洪山东板块" ))
    #df0 <-dplyr::filter(df, 板块名称 %in% c("洪山西板块", "狮子山洪山板块" ))
    
    #-----------------------------数理统计------------------------------------
    df1 <- df0 %>% count(`板块名称`,`监测区名称`,`小区名称`)
    names(df1)[names(df1) == 'n'] <- '采集数量'
    
    df2 <- df0 %>% group_by(`监测区名称`,`小区名称`) %>% summarize(最低租金=min(`租金单价`))
    df3 <- df0 %>% group_by(`监测区名称`,`小区名称`) %>% summarize(最高租金=max(`租金单价`))
    df4 <- df0 %>% group_by(`监测区名称`,`小区名称`) %>% summarize(平均租金=mean(`租金单价`))
    df5 <- df0 %>% group_by(`监测区名称`,`小区名称`) %>% summarize(区间下限=quantile(`租金单价`,0.25))
    df6 <- df0 %>% group_by(`监测区名称`,`小区名称`) %>% summarize(区间上限=quantile(`租金单价`,0.75))
    df7 <- df0 %>% group_by(`监测区名称`) %>% summarize(监测区平均租金=mean(`租金单价`))
    dfgroup <- df1%>% full_join(df2)%>% full_join(df3)%>% full_join(df4)%>% full_join(df5)%>% full_join(df6)%>% full_join(df7)
    #-----------------------------导出------------------------------------
    write_csv(dfgroup, "dfgroup.csv")
    
    

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值