- 对baseline的解读。
Baseline给出两种方法计算共享单车的潮汐情况。方法1使用geohash库,对经纬度编码,将一定精度范围内的区域视为同一区域,计算每个区域的入流量和出流量。接着由出入流量之差,计算该位置的留存量。然后提取街道信息,根据“留存车辆 / 街道停车位总面积”,计算得到道路上的车密度。
方法2对经纬度距离应用KNN方法聚类,得到停车点和密度。
方法1的统计方法可能会不准确,精度只能到街道信息,故倾向于选择方法2。
计算完潮汐点之后,开始研究停车点推荐。Baseline的策略是:根据距离选择最近的20个待选位置;剔除已经有很多车辆堆积的地方;剔除其他街道的地方。最后,还考虑了单车没有骑到停车点的情况,根据经纬度推荐最近非潮汐停车点。 - 进一步优化思考。
简单思考如下:
1)Baseline计算潮汐点时,时间精度为小时,但是工作日人们上班的时间很接近,大多集中在早上8-10之间,潮汐的形成和对人们的影响也大多发生在这段时间,因此有必要对一些重点时段进行更精细的时间段研究。
2)推荐潮汐点时,只考虑了基于经纬度计算的空间距离,同时剔除了不同街道的停车点。这样可能跟实际停车所需的距离有差异。比如一排建筑物两侧的停车点,可能空间距离不远,但是实际要绕路才能到达。又比如两个点虽然分属两个街道,但实际上很近,这种情况也是很常见的。所以是否可以通过引入第三方地图接口,来获得两点间骑车路线的长度作为参考,以供推荐用?