Python
阿龙的圈子
仰望星空 脚踏实地
向前走 永不停
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python urllib2实例代码演示
使用urllib2访问页面: import urllib2 import cookielib url = "http://www.baidu.com" print 'The first method : ' response1 = urllib2.urlopen(url) print response1.getcode() print len(response1.read()) print原创 2016-05-10 10:04:54 · 5409 阅读 · 0 评论 -
Python 网页解析器BeautifulSoup示例使用
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间。 接下来,快事使用一些编程范例,使得尽快熟悉BeautifulSoup使用方法: # coding:utf8 import re from bs4 import Beau原创 2016-05-12 11:24:39 · 3810 阅读 · 0 评论 -
Python 简易网络爬虫的编写——抓取任意页面数目百度百科内容
该爬虫爬取百度百科"Python"词条有关的一千个页面 爬虫架构: 分为5个模块: 1. 程序入口:spider_main 2. url管理器:url_manager 3. html下载器:html_downloader 4. html解析器:html_parser 5.html输出器:html_outputer 所有代码打包上传,网址为:原创 2016-05-12 22:12:51 · 1761 阅读 · 0 评论 -
Python简易爬虫--抓取任意数目百度百科内容
使用Python语言,编写简单的爬虫程序,在百度百科页面上爬取跟词条“Python”有关的1000个页面(页面数目可以自己任意设定)。 这个简易的爬虫项目可以分为5个模块: 首先,需要有一个程序入口spider_main,同时作为爬虫的总控程序(调度程序), 改程序需要进行初始化: self.urls = url_manager.UrlManger()原创 2016-05-13 09:12:08 · 1134 阅读 · 0 评论 -
Python处理excel数据
Python操纵excel,控制读写原创 2016-08-23 13:02:54 · 10052 阅读 · 1 评论
分享