类别数据
用sample函数随机生成调查表
> opinion<-sample(c("赞成","反对"),20,replace = TRUE)
> home<-sample(c("社区A","社区B","社区C"),10,replace = TRUE)
> sex<-sample(c("男","女"),20,replace = TRUE)
> myinfo<-data.frame("社区"=home,"性别"=sex,"态度"=opinion)
> myinfo
社区 性别 态度
1 社区B 女 赞成
2 社区B 男 赞成
3 社区C 女 赞成
4 社区B 女 反对
5 社区B 女 反对
6 社区B 男 反对
7 社区B 男 赞成
8 社区C 女 反对
9 社区C 男 反对
10 社区A 女 赞成
11 社区B 男 赞成
12 社区B 女 反对
13 社区C 女 赞成
14 社区B 男 赞成
15 社区B 男 赞成
16 社区B 女 反对
17 社区B 女 赞成
18 社区C 女 反对
19 社区C 女 赞成
20 社区A 男 反对
这里涉及三个类别变量:社区、性别和态度
简单频数表:也称为一维列联表
summary函数:生成频数分布表
> summary(myinfo)
社区 性别 态度
社区A: 2 男: 8 反对: 9
社区B:12 女:12 赞成:11
社区C: 6
table函数:生成频数分布表
R语言统计:数据频数分布可视化

本文探讨了如何使用R语言对类别和数值数据进行频数分布的可视化。从简单频数表到二维、多维列联表的创建,再到数值数据的分组分析,通过sample、summary、table、prop.table、addmargins、CrossTable、ftable等函数展示了详细的处理过程。
最低0.47元/天 解锁文章
2391

被折叠的 条评论
为什么被折叠?



