老师提出了一个tsp问题的实战项目,让我们自己爬南京40多家景点间的距离去做。为此我自学了selenium库,花了一天时间编出了一段简单的爬取百度地图页面的代码。
selenium的安装和驱动安装十分简单,搜索即可。元素定位的几种方法也有相关文章。如何找到元素可以在元素上右键,推荐采用Xpath,在查看器中右键即可找到X-path。
百度地图进入后界面如下:

我使用的是火狐浏览器,查看元素定位是为了定位这个按钮在何处,关于元素定位的几种方法网上很多。知道这个按钮的X_PATH之后的采用X_path定位。selenium就是模仿人单击单击再单击,滚轮,键入等等等等。在一系列操作以后,得到我想要的两地之间的时间。


之后我用正则对时间做了一个小转换,变成分钟计的数值。整体代码如下:

为了解决TSP问题实战项目,作者自学selenium爬取了百度地图上的南京40多个景点之间的驾车时间。通过元素定位、XPATH以及模拟点击等操作,获取了两地之间的行驶时间,并利用正则表达式将时间转换为分钟。然而,程序在处理弹窗选择精确地点时存在不足,目前通过延长休眠时间来解决,未来计划进行优化。
最低0.47元/天 解锁文章
3096

被折叠的 条评论
为什么被折叠?



