一个之前未解决的遗留问题
之前实习的时候偶然间被询问了一个数据结构变形的问题,但是是在excel里,所以不太会,最近学R,发现R解决起来还挺方便,整理了一下放在这里,以便日后需要再来查阅。
工具:R, tapply, tidyr - spread, sqldf - sqldf
问题描述:
如果有这样的一个数据集

要如何把它变成这种结构:
| a1 | b1 | c1 | d1 | |
|---|---|---|---|---|
| A | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) |
| B | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) |
| C | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) |
| D | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) |

本文介绍了如何使用R语言解决数据变形问题,具体包括使用tapply函数和tidyr-spread结合sqldf的方法。通过案例展示了如何将原始数据结构转换为所需形式,同时分析了两种方法的优缺点。
最低0.47元/天 解锁文章
2263

被折叠的 条评论
为什么被折叠?



