
爬虫
syuuenn
这个作者很懒,什么都没留下…
展开
-
爬虫初试requests模块使用
爬虫是什么?简单而言爬虫就是请求网站并提取数据的自动化程序。爬虫的基本步骤首先是发起请求获取响应的内容,然后解析内容,最后进行数据的保存。下面写一个最简单的案例。import requestsurl = 'http://imgsrc.baidu.com/forum/w%3D580/sign=c3e5ef1a75899e51788e3a1c72a6d990/793d269759ee3d6da...原创 2019-07-25 16:32:50 · 186 阅读 · 0 评论 -
爬虫中xpath的相关知识
1、XML语言<?xml version="1.0" encoding="ISO-8859-1"?><bookstore><book> <title lang="en">Harry Potter</title> <author>J K. Rowling</author> <year>...原创 2019-07-25 16:48:44 · 188 阅读 · 0 评论 -
beautifulsoup的应用
beautifulsoup是一个灵活又方便的网页解析库,处理高效,支持多种解析器。from bs4 import BeautifulSouphtml = '''<html><head><title>The Dormouse's story</title></head><body><p class="title...原创 2019-07-25 17:13:45 · 351 阅读 · 0 评论