介绍
现在有很多网站,做的很精美和漂亮,如果我们想要仿照这些网站进行设计和制作,一个个网页去copy他们的源代码是否有点费时费力,那么有没有更好的方法呢?
这时候“爬虫”这个技术就可以解决我们的难题,那么它究竟是什么呢?
其实就是模拟http请求,然后将网页上面所获得的数据,保存下来,就这么简单。
实现步骤
1、选定入口url,也就是你从这个地方进入,也就是请求的地址。
2、找到html页面中想要获取的数据,比如说图片,文字,等…….确定你想要抓取的数据所在的位置。
3、开始爬虫
好的,爬虫先简单介绍到这里,下一篇文章开始介绍具体实现。