
Python爬虫从入门到精通
一无是处的研究僧
这个作者很懒,什么都没留下…
展开
-
Python爬虫从入门到精通——入门案例01[发送网络请求,解析网页的三种方式]
爬取古诗文网首页的所有诗文的名称 网页的地址是:https://so.gushiwen.org/gushi/tangshi.aspx 上面就是网页源码经过浏览器渲染之后的样子 在上面的页面,点击鼠标右键,点击查看网页源码或者View Page source,向下滑动就可以看到: 我们就是要提取上面网页源码中的所有诗词的名称,下面看下面代码,有详细的代码解释 用正则表达式提取文字 from ur...原创 2020-02-02 19:57:11 · 308 阅读 · 0 评论 -
Python网络爬虫入门介绍
Python网络爬虫是在干什么? 首先,我们明确一点爬虫是模拟浏览器发送请求,然后模拟浏览器解析返回的各种数据,比如HTML,JSON数据,视频,照片等等文件。因此,学习爬虫最重要的就是这两个模块。 模拟浏览器发送请求 我们最常见的就是post和get请求,学习完这两个模块就可以爬去大部分网页了。我们所有的高级爬虫都是基于基本的请求发送的,因此理解和熟练掌握这些基本的技能是尤为重要的。 下面列...原创 2020-01-31 17:30:43 · 154 阅读 · 0 评论