终于在第五篇文章我们进入了这个系列的正题:数据分析
这里我选择上海2024年5月1日——5月5日的迁入、迁出数据作为分析的基础,首先选择节假日的数据作为分析的原因呢,主要是节假日人们出行目的比较单一(出游、探亲),更容易反应节假日客流特征,当然也不排除以出差或者其他出行目的的人群。我们更多的是讨论倾向性。
先摆一下2024年5月1日——5月5日的迁出比例数据:
以上海2024年5月1日迁出城市前20为例,为什么取前20呢,首先前20的迁出比占了上海总迁出比的65.8%,超过半数的数据比例,另外原始数据有超过370+的地级市,在地图上展示很难抓住有效性信息,那索性我们就把视角放到较中观的视角,可以帮助我们发现一些不曾关注过的细节。
好了,直截了当开始分析,我们对数据进行可视化可以发现占上海总迁出比最大的城市是苏州15.67,稳居第一,超过第二名接近3倍,形成了''一超多强''的客流迁徙模型 ,通过自然间断法可以发现一超是''苏州市'',多强为周边的''南通市''、''杭州市''、''嘉兴市''、''湖州市'',相对较远的无锡市、绍兴市、宁波市等城市则为第三梯队;