爬虫实战
Atom爱疼
do it
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
豆瓣影评爬虫——导出excel
豆瓣影评爬虫——导出excel#导入库import requestsfrom bs4 import BeautifulSoupimport xlwtimport time#创建worbookworkbook = xlwt.Workbook(encoding='utf-8', style_compression=0)sheet = workbook.add_sheet('movie...原创 2019-05-08 21:45:22 · 1383 阅读 · 1 评论 -
爬虫:re库的使用
https://blog.youkuaiyun.com/qq_1290259791/article/details/80979384原创 2018-11-04 00:28:34 · 698 阅读 · 0 评论 -
爬虫:html网页源码标签
了解HTML网页标签的分类至关重要。网站:http://www.w3school.com.cn/tags/tag_hr.asp详细描述了html网页标签的分类。常见的html标签:<div></div> 表示模块,某个区域的框架<p></p> 表示字符信息,写文字内容<li></li> 表示列表<...原创 2018-11-02 16:30:53 · 1123 阅读 · 0 评论 -
爬虫:BeautifulSoup库的使用
BeautifulSoup库中文文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/常用函数:soup.select():按路径搜索需要的内容soup.select("p nth-of-type(3)")# [<p class="story">...</p>]soup.find_al...原创 2018-11-02 16:30:29 · 361 阅读 · 0 评论 -
爬虫:requests & BeautifulSoup 实战案例
爬取猫途鹰旅游网站:https://www.tripadvisor.cn/Attractions-g60763-Activities-New_York_City_New_York.html景点信息from bs4 import BeautifulSoupimport requestsurl_saves = 'http://www.tripadvisor.com/Saves#3768...原创 2018-11-02 16:42:36 · 1023 阅读 · 0 评论
分享