
python爬虫
苏幕遮灬淩枫
唯有自律,方能掌控自己的狗生!
展开
-
Python爬虫从入门到懵逼-0
初识Python2.7 urllib库1.实现简单网页爬取,并将网页HTML写到本地磁盘 首先,爬取百度首页(http://www.baidu.com)将内容读取出来付给一个变量 以写入的方式打开一个本地文件,命名为*.html格式 -关闭该文件 *read() 读取文件的全部内容 readline()读取文件的一行 readlines()将读到的内容赋给一个列表变量*#--coding:原创 2017-07-16 14:13:38 · 362 阅读 · 0 评论 -
正则表达式
初识正则正则表达式是一个特殊的字符序列,一个字符串是否与我们设定的这样的字符序列相匹配 用于检查一个字符串是否是电话号码 是否是正常的邮箱地址 import re str="Is mark there? who is Mark" result = re.findall("mark", str) print(result) ----------------------------- C:\Python原创 2017-10-03 17:30:47 · 211 阅读 · 0 评论 -
熊猫TV王者荣耀主播人气TOP10
----------简易爬虫展示农药主播人气--- import re import urllib.request as reqURL = "https://www.panda.tv/cate/kingglory" m = req.urlopen(URL).read() f = str(m, "utf-8") #这是个值得注意的细节pattern_1 = '<div class="video-inf原创 2017-10-20 01:27:06 · 2413 阅读 · 0 评论