在上一篇文章中,我们简单了解了 输入条件的判断,包括出发站,到达站,和出发的时间,获取车次信息的链接;
12306车站信息爬取(1)——输入条件的判断,包括出发站,到达站,和出发时间,并获取车次信息的链接
在这一篇文章中,主要涉及到的内容有:车次信息的爬取。
在上一篇文章中,我们已经获取了车票信息的链接(就是下图的Request URL),针对获取的链接,我们进行分析
针对上图,我们查看Preview,我们看到如下类似字典的信息,其中,result中的链接信息就是每个车次的信息;
针对result中的每个链接,我们进行分析,可以发现我们需要的信息,信息都是通过 | 进行分开的,所以,我们可以根据 | 对链接进行分割,通过索引获取所需的内容(还有一些没有标注出来,但都在链接中可以找到);
为了方便获取索引,我们可以借助记事本或者其他工具,将|替换为换行,可以很清楚的看出每个信息对应的行号,也就会知道对应的索引。
经过简单的分析,我们已经知道了车票信息如何获