DataWhale组队学习分享1-早高峰共享单车潮汐点的群智优化

最新推荐文章于 2025-02-15 20:09:42 发布

ljchyes

最新推荐文章于 2025-02-15 20:09:42 发布

阅读量385

点赞数

CC 4.0 BY-SA版权

文章标签：数据挖掘

本文链接：https://blog.youkuaiyun.com/ljchyes/article/details/113868622

文章探讨了两种共享单车潮汐情况的计算方法，包括基于geohash的统计和KNN聚类，并指出了方法1的局限性。推荐策略主要基于距离，但忽略了实际骑行路线。提出了改进思路，如细化时间精度和结合路线长度优化停车点推荐。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

                    
                    对baseline的解读。

Baseline给出两种方法计算共享单车的潮汐情况。方法1使用geohash库，对经纬度编码，将一定精度范围内的区域视为同一区域，计算每个区域的入流量和出流量。接着由出入流量之差，计算该位置的留存量。然后提取街道信息，根据“留存车辆 / 街道停车位总面积”，计算得到道路上的车密度。

方法2对经纬度距离应用KNN方法聚类，得到停车点和密度。

方法1的统计方法可能会不准确，精度只能到街道信息，故倾向于选择方法2。

计算完潮汐点之后，开始研究停车点推荐。Baseline的策略是：根据距离选择最近的20个待选位置；剔除已经有很多车辆堆积的地方；剔除其他街道的地方。最后，还考虑了单车没有骑到停车点的情况，根据经纬度推荐最近非潮汐停车点。
进一步优化思考。

简单思考如下：

1）Baseline计算潮汐点时，时间精度为小时，但是工作日人们上班的时间很接近，大多集中在早上8-10之间，潮汐的形成和对人们的影响也大多发生在这段时间，因此有必要对一些重点时段进行更精细的时间段研究。

2）推荐潮汐点时，只考虑了基于经纬度计算的空间距离，同时剔除了不同街道的停车点。这样可能跟实际停车所需的距离有差异。比如一排建筑物两侧的停车点，可能空间距离不远，但是实际要绕路才能到达。又比如两个点虽然分属两个街道，但实际上很近，这种情况也是很常见的。所以是否可以通过引入第三方地图接口，来获得两点间骑车路线的长度作为参考，以供推荐用？