Python爬虫
·慕晴·
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
爬取糗事百科的笑话,每按一下Enter键,输出一条信息
这是一个简单的爬虫,爬取糗事百科的笑话,每按一下Enter键,输出一条信息。'''author:superWangdate:2017-09-14爬取糗事百科的笑话'''#!/usr/bin/env python#-*- coding:utf-8 -*-import requestsfrom bs4 import BeautifulSoupimport reclass GetQiuShi原创 2017-09-14 23:45:09 · 449 阅读 · 0 评论 -
python爬取百度新闻所有的新闻的前1页 标题和URL地址
这是我自己写的一个爬取百度新闻的一个代码,欢迎大家多来讨论,谢谢!(自己已经测试可以使用,在最后见效果图)'''爬取百度新闻所有的新闻的前1页 标题和URL地址'''import requestsimport jsonfrom bs4 import BeautifulSoupimport re#获得每页新闻标题和新闻地址def getPageInfo(url,page): ne原创 2017-09-06 11:27:42 · 6072 阅读 · 2 评论 -
python爬取贴吧网页信息
第一步分析网页代码如下:'''author:superWangdate:2017-09-15requests模板:2.18.4bs4模板:4.6.0json模板:2.0.9time模板:无爬取贴吧网页http://c.tieba.baidu.com/p/4994831746?pn=1 中的信息 ,url中pn=1表示第一页'''#!/usr/bin/env python#-*- c原创 2017-09-18 10:03:30 · 1193 阅读 · 0 评论 -
python对URL的编码和解码
@pythonimport urllib#解码print(urllib.parse.unquote('https%3A%2F%2Fapi.47ks.com%2Fconfig%2Fgetinfo.m3u8%3Fpt%3Dyouku%26src%3Dwebcloud%26t%3D1505203028%26vid%3DXMzAxOTE3ODg3Ng%253D%253D%26k%3D0a88ECxah原创 2017-09-12 16:35:49 · 1130 阅读 · 0 评论 -
python爬取贴吧网页信息
第一步分析网页代码如下:'''author:superWangdate:2017-09-15requests模板:2.18.4bs4模板:4.6.0json模板:2.0.9time模板:无爬取贴吧网页http://c.tieba.baidu.com/p/4994831746?pn=1 中的信息 ,url中pn=1表示第一页'''#!/usr/bin/env python#原创 2019-03-19 17:38:27 · 707 阅读 · 0 评论
分享