文章转载自公众号 林骥 , 作者 林骥
0. 序言
整理的意思,是整顿使之有条理,目标是让零散杂乱的数据变得井然有序。
许多分析数据的时间。
做数据分析工作,表面是在制作数据报表、提交分析报告,背后其实是你数据分析思维的体现。
如果借用「前台、中台、后台」的概念来解释的话,那么展现数据和总结报告属于「前台」,处理数据和分析数据属于「中台」,而明确目标和应用思维就属于「后台」。
前台直接面向客户,是实现价值的重要途径。夸前台,通常会说“真漂亮”。
中台是为前台而生,为了更好地服务前台,它是前台与后台之间的桥梁,起着非常重要的作用,中台具有灵活调整、随需应变的特征,从而更好地适应不断变化的环境。夸中台,通常会说“有能力”。
后台支撑着整个数据分析体系,它是数据分析的基石。夸后台,通常会说“好强大”。
前台仅仅是冰山一角,水下的中台和后台,其实隐藏着无数的奥秘。
1. 数据准备
首先,为了演示整理数据的方法,我们从 www.gapminder.org/data 下载 2 个数据文件,分别是世界各国的人口数量、预期寿命,保存到本地当前目录下的 data 文件夹中。
其次,为了便于理解,我们选取其中几个国家 2018 年的数据,第 1 个表是中国和印度 2018 年的人口数量。