python-爬虫
Weize Tang
Stop thinking,worrying,wondering,doubting,fearing,hurting,struggling,itching,scratching,rumbling,gambling,nit-picking.Stop it and just do it
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python 不换行输出
print默认换行输出, 今天看人家代码偶然发现一个不换行,且多重输出可以覆盖原输出的方法。print("/r已完成 {:.2f}%".format(i/100000), end = "") end = “”输出没有换行, /r 即是在原输出地方覆盖完整代码如下for i in range(1000000): print("/r已完成 {:.2f}%".form原创 2017-04-09 18:21:03 · 3842 阅读 · 0 评论 -
re库正则表达式常用操作符
. 表示任何单个字符 [ ] 对单个字符给出取值范围 [abc] 表示a,b,c一个[a-z]表示a到z单个字符 [^ ] 对单个字符给出排除范围 * 对前一个字符0到若干次扩展 + 对前一个字符1到若干次扩展 ? 对前一个字符0到1次扩展 | (或者原创 2017-04-02 15:20:05 · 507 阅读 · 0 评论 -
Python re库 非贪婪匹配(正则表达式库)
re库中默认采用贪婪匹配,即同一个字符串多处符合条件的话,输出最长的那个子串。import rer = re.search(r'PY.*N','PYTHONFTTN')print(r.group(0))如果需要最小输出匹配import rer = re.search(r'PY.*?N','PYTHONFTTN')print(r.group(0))最小匹配操作符 ? 常用的是:原创 2017-04-02 14:52:54 · 983 阅读 · 0 评论 -
Python 以指定宽度格式化输出(format)
当对一组数据输出的时候,我们有时需要输出以指定宽度,来使数据更清晰。这时我们可以用format来进行约束。mat = "{:20}\t{:28}\t{:32}"print(mat.format("占4个长度","占8个长度", "占12长度"))#如果需要居中输出在宽度前面加一个^mat = "{:^20}\t{:^28}\t{:^32}"print(mat.format("占4个长度",原创 2017-04-05 00:02:55 · 58992 阅读 · 3 评论 -
网页解析库 Beautifull Soup 常用方法
from bs4 import BeautifulSoupsoup = BeautifulSoup(demo,"html.parser")#demo是已经提取出来的html文档# 获取soup里面的a标签内容:print(soup.a)#获取a标签的父亲标签的名字print(soup.a.parent.name)#获取标签中的属性(attribute)由于他是字典类型,我们可以输入对应原创 2017-04-06 18:07:21 · 546 阅读 · 0 评论
分享