- 博客(2)
- 收藏
- 关注
原创 python爬虫从零到0.5(二)
BeautifulSoup库:是一个网页解析库,用以对响应返回的标准化网页进行解析BeautifulSoup(html,parse),parse可以替换为别的解析库,返回一个BeautifulSoup类对象python标准库,'html.parse'lxml解析,'lxml'xml解析,'xml'html5lib解析,'html5lib',以浏览器方式解析文档,生成HTML5格式的文档返回一个&l...
2018-04-19 15:55:05
219
原创 python爬虫从零到0.5(一)
爬虫原理:由终端(个人电脑)通过向指定的服务器(域名url)发送请求(request)并得到一个响应(response),再由网页解析工具库(如BeautifulSoup库,正则表达式语言)使用标准化的解析语言对响应(response)的内容(response.text)或对象(response.selector)进行内容查找和解析,一般是对含有标签的网页代码进行解析。最后输出,输出的形式当可以是...
2018-04-17 20:01:48
351
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人