
Python
python
_a_0_
Who am, Where am.
展开
-
Python爬虫学习---------根据分类爬取豆瓣电影的电影信息
代码的入口:if __name__ == '__main__': main()#! /usr/bin/python3# -*- coding:utf-8 -*-# author:Sirius.Zhaoimport jsonfrom urllib.parse import quotefrom urllib.request import urlopenfrom urllib.req...原创 2018-04-01 17:46:57 · 3339 阅读 · 0 评论 -
爬虫中使用正则表达式
为什么要学正则表达式实际上爬虫一共就四个主要步骤:明确目标 (要知道你准备在哪个范围或者网站去搜索)爬 (将所有的网站的内容全部爬下来)取 (去掉对我们没用处的数据)处理数据(按照我们想要的方式存储和使用)我们在昨天的案例里实际上省略了第3步,也就是"取"的步骤。因为我们down下了的数据是全部的网页,这些数据很庞大并且很混乱,大部分的东西使我们不关心的,因此我们需要将之按我们的需要过滤和匹配出来...转载 2018-03-27 14:18:51 · 937 阅读 · 0 评论 -
Beautiful Soup4.2文档
Beautiful Soup 4.2.0 文档Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.这篇文档介绍了BeautifulSoup4中所有主要特性,并且有小例子.让我来向你展示它适合做什么,如何工作,怎样使用,如何达到你想要...原创 2018-03-27 14:54:03 · 219 阅读 · 0 评论 -
Python爬虫学习---------爬取足球直播吧五大联赛积分榜
使用BeautifulSoup4解析爬取足球直播吧五大联赛积分榜信息;#! /usr/bin/python3# -*- coding:utf-8 -*-from urllib.request import urlopenfrom urllib.request import quotefrom bs4 import BeautifulSoupimport timeimport reim...原创 2018-03-28 18:55:58 · 5525 阅读 · 0 评论 -
Python爬虫学习---------使用beautifulSoup4爬取名言网
爬取名言网top10标签对应的名言,并存储到mysql中,字段(名言,作者,标签)#! /usr/bin/python3# -*- coding:utf-8 -*-from urllib.request import urlopen as openfrom bs4 import BeautifulSoupimport reimport pymysqldef find_top_t...原创 2018-03-28 21:43:15 · 674 阅读 · 0 评论