构建查找廉价机票的应用程序
1. 解析DOM提取定价数据
DOM(文档对象模型)是构成网页结构的元素集合。如果你查看过网页源代码,就会看到DOM的组成部分,包括 body 、 div 、 class 和 id 等元素和标签。我们需要利用这些元素来提取所需的数据。
以下是查看Google航班页面DOM的步骤:
1. 右键点击页面,选择“检查元素”(Firefox或Chrome操作相同),这将打开开发者工具,让你查看页面源代码信息。
2. 打开开发者工具后,选择左上角的元素选择器,然后点击其中一个价格条,即可跳转到该元素。
你可能会注意到, div 标签中并没有直接的定价数据。当你将鼠标悬停在价格条上时,会弹出一个工具提示显示票价,但这是通过JavaScript实现的,在DOM中无法直接获取。实际上,我们能获取的只有代表票价的价格条高度。不过,页面提供了足够的线索,让我们可以根据价格条的高度推断出票价。
每个城市列出的一个票价是最优票价,你可以在柱状图的左侧看到。这个 div 以文本形式提供了票价。而且,每个城市都有一个代表最低票价的价格条,它的颜色比其他价格条更深,因为它有一个独特的类来生成这种颜色,我们可以找到它。找到后,用它的高度除以价格,就能确定每像素的价格,进而推算出每个航班的票价。
以下是实现代码:
from bs4 import BeautifulSou
超级会员免费看
订阅专栏 解锁全文
736

被折叠的 条评论
为什么被折叠?



