R语言数理统计之对某列值进行描述性分析
- 导入相关包
- 导入文件
- 选择所需列
- 对指定行进行筛选
- 分组计数:修改合计列名
- 分组摘要:最大最小平均分位数
- 合并连接各表
- 导出文件
library(tidyverse) library(readxl) wc0 <- read_excel("wc4.xlsx", sheet = "wc0") wc1 <- read_excel("wc4.xlsx", sheet = "wc1") df <- select(wc1,板块名称,监测区名称,小区名称,租金单价) df0 <-dplyr::filter(df, 板块名称 %in% c("广埠屯板块", "洪山东板块" )) #df0 <-dplyr::filter(df, 板块名称 %in% c("洪山西板块", "狮子山洪山板块" )) #-----------------------------数理统计------------------------------------ df1 <- df0 %>% count(`板块名称`,`监测区名称`,`小区名称`) names(df1)[names(df1) == 'n'] <- '采集数量' df2 <- df0 %>% group_by(`监测区名称`,`小区名称`) %>% summarize(最低租金=min(`租金单价`)) df3 <- df0 %>% group_by(`监测区名称`,`小区名称`) %>% summarize(最高租金=max(`租金单价`)) df4 <- df0 %>% group_by(`监测区名称`,`小区名称`) %>% summarize(平均租金=mean(`租金单价`)) df5 <- df0 %>% group_by(`监测区名称`,`小区名称`) %>% summarize(区间下限=quantile(`租金单价`,0.25)) df6 <- df0 %>% group_by(`监测区名称`,`小区名称`) %>% summarize(区间上限=quantile(`租金单价`,0.75)) df7 <- df0 %>% group_by(`监测区名称`) %>% summarize(监测区平均租金=mean(`租金单价`)) dfgroup <- df1%>% full_join(df2)%>% full_join(df3)%>% full_join(df4)%>% full_join(df5)%>% full_join(df6)%>% full_join(df7) #-----------------------------导出------------------------------------ write_csv(dfgroup, "dfgroup.csv")