python
文章平均质量分 88
sonson45
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python编码问题
几个概念性的东西 ANSCII: 标准的 ANSCII 编码只使用7个比特来表示一个字符,因此最多编码128个字符。扩充的 ANSCII 使用8个比特来表示一个字符,最多也只能 编码 256 个字符。 UNICODE: 使用2个甚至4个字节来编码一个字符,因此可以将世界上所有的字符进行统一编码。 UTF: UNICODE编码转换格式,就是用来指导如何将 unic转载 2012-12-07 10:25:02 · 494 阅读 · 0 评论 -
Python 爬虫抓站 记录(虾米,百度,豆瓣,新浪微博)
python 下用到的库,urllib, urllib2, BeautifulSoup, cookielib, mechanize, re看Firebug模拟浏览器行为。1. 虾米虾米不用登陆,没有IP限制,最简单。Python抓了下Xiami电台的试听数 里用的是import urllib2content = urllib2.urlopen('http://www.xiami转载 2012-12-07 10:31:50 · 1367 阅读 · 0 评论 -
python访问web的利器:urllib2
使用Python访问网页主要有三种方式: urllib, urllib2, httpliburllib比较简单,功能相对也比较弱,httplib简单强大,但好像不支持session1. 最简单的页面访问res=urllib2.urlopen(url)print res.read()2. 加上要get或post的数据data={"name":"hank", "passwd":转载 2012-12-07 16:31:26 · 628 阅读 · 0 评论 -
re正则表达式
字元功能說明\number代表除了換行字元以外的所有字元。\d代表字串位於開頭。\D代表字串位於結尾。\s代表空格字元,即r'[ \t\n\r\f\v]'。\S代表非空格字元,即r'[^ \t\n\r\f\v]'。转载 2012-12-07 16:21:46 · 1128 阅读 · 0 评论 -
使用python抓取网页(以人人网新鲜事和团购网信息为例)
from http://www.pinkyway.info/2010/12/19/fetch-webpage-by-python/?replytocom=448by 颖风斯特 BeautifulSoup,Python, urllib, 人人网, 团购12 Comments前一段时间写的小东西,一直没工夫把他系统写出来,今天眼睛疼,就写写吧~~(原来博主不蛋疼时也会更新转载 2012-12-07 16:23:55 · 1091 阅读 · 0 评论 -
python mysqldb模块
linux版本http://sourceforge.net/projects/mysql-python/ 下载,在安装是要先安装setuptools,然后在下载文件目录下,修改mysite.cfg,指定本地mysql的mysql-config文件的路径windows版本网上搜索到一个http://www.technicalbard.com/files/MySQL-python-1.2.转载 2012-12-07 16:28:46 · 574 阅读 · 0 评论 -
httplib2模块
深入#单地讲,HTTP web 服务是指以编程的方式直接使用 http 操作从远程服务器发送和接收数据。如果你要从服务器获取数据,使用http GET;如果你要向服务器发送新数据,使用http POST. 一些更高级的http Web 服务 api也允许使用http PUT 和 http DELETE来创建、修改和删除数据。 换句话说,http 协议中的“verbs (动作)” (转载 2012-12-07 16:37:38 · 2729 阅读 · 0 评论
分享