一般来说,大家调用API 获取数据的格式大多数是json 格式
但通常数据分析师都会喜爱用tabulation 格式的数据做分析,那么数据由 API 转交到分析师(有时候,对于独立开发者来说,分析师就是自己)手里时,必定需要做转化。那转化过程必然需要编写代码,当面对不同栏位的json array 时,能否灵活地转化数据格式,又不用修改代码呢🤔 以下是我使用Python的做法,转化过程我会使用一个叫tablib 的程序库
首先,先定义一个用作设定转化栏位的设定档,我是使用json 格式的设定档。
在这个设定档,我定义了 层级结构, 读取的栏位名称等等。使用设定档的原因是将来转化的数据结构改变时,只需要依据设定档的定义就能转化,不需要修改代码
然后编写代码,代码根据设定档的定义读取json 档案的资料,然后再根据设定档的定义再去构建dataframe。当dataframe 构建完成后,无论是转化为csv 或是excel 档案 都只是一行代码的事 🫡