
Python爬虫从入门到精通实践系列讲解
以开源数据爬取实战为基础,逐步扩展并深入学习爬虫的精髓,以达到可以独立完成数据爬取的地步,当然这个过程会有点长,我们一起来学习,一起进步。
七月学长
互联网行业7年软件开发,熟练掌握JAVA,C 以及Python等语言的开发,可以对于新手给些建议和辅导。本博客本着技术学习和探讨以及问题记录等方面来更新。
展开
-
爬虫的基本原理
我们从今天开始来学习爬虫这个神奇的东西,我们先来认识下爬虫 一、什么是爬虫 1、爬虫其实就是网络爬虫,可以理解为网络上爬行的一只蜘蛛。就是请求网站并提取数据的自动化程序 2、获取到的网页资源实际是html代码,这里面包括标签和文字 3、右键->审查元素->Elements选项卡(显示网页的源代码) 4、看到的网页就是由源代码解析出来的网页,超链接在网页中看不到,需要经过解析 二、爬虫的...原创 2020-04-01 16:37:09 · 3293 阅读 · 2 评论 -
会写爬虫的大牛们真的了解urllib吗?
说起urllib,我想每个会写爬虫或者说听过爬虫的人都不陌生,它是爬虫的基本和常用库之一,我们今天就来从头到尾了解下。 一、什么是Urllib 1、Python的内置HTTP请求库,常用模块如下 (1)Urllib.request 请求模块(用来整理和发送请求) (2)Urllib.error 异常处理模块 (3)Urllib.parse url解析模块 (4)Urllib....原创 2020-04-01 21:42:17 · 197 阅读 · 1 评论