目录
在 Python每日一练(15)-爬取网页中动态加载的数据 一文中笔者已经讲过如何爬取动态加载的数据,本文在对其进行详细的讲解。在我们平时浏览网页的过程中,可以发现有很多网站显示在页面上的数据并不是一次性从服务端获取的,有一些网站,如图像搜索网站,当滚动条向下拉时,会随着滚动条向下移动,有更多的图片显示出来。其实这些图片都是通过异步的方式不断从服务端获取的,这就是异步数据,如京东。
1. 异步加载与AJAX
传统的网页如果要更新动态的内容,必须重新加载整个网页,因为不管是动态内容,还是静态内容,都是通过服务端以同步的方式按顺序发送给客户端的,一旦某些动态内容出现异常,如死循环,或完成非常耗时的操作,就会导致页面加载非常缓慢,即使动态部分不发生异常,如果动态部分的内容非常多,也会出现页面加载缓慢的现象,尤其是在网速不快的地方,非常让人抓狂。为了解决这个问题,有人提出了异步加载解决方案,也就是让静态部分(HTML、CSS、JavaScript等)先以同步的方式装载,然后动态的部分再另外向服务端发送一个或多个异步请求,从服务端接收到数据后