
Python爬虫
Python爬虫实例
弓长女爱♡
这个作者很懒,什么都没留下…
展开
-
Python爬虫学习之爬取豆瓣电影Top250写入txt文件
from urllib.request import urlopen, Requestfrom bs4 import BeautifulSoupimport re# 将操作码保存为txt文件def text_save(filename, data): # filename为写入txt文件的路径,data为要写入数据列表. file = open(filename, 'w') for i in range(len(data)): s = str(data[i]).原创 2021-01-10 11:20:46 · 1913 阅读 · 3 评论 -
Python爬虫学习之爬取2020年《财富》世界500强排行榜写入txt文件
import requestsfrom urllib.request import urlopen, Requestfrom bs4 import BeautifulSoupimport re# 将操作码保存为txt文件def text_save(filename, data): # filename为写入txt文件的路径,data为要写入数据列表. file = open(filename, 'w', encoding = 'utf-8') for i in range(len原创 2021-01-10 11:12:47 · 1508 阅读 · 0 评论 -
Python爬虫学习之爬取学校排名写入txt文件
import requestsfrom urllib.request import urlopen, Requestfrom bs4 import BeautifulSoupimport re# 将操作码保存为txt文件def text_save(filename, data): # filename为写入txt文件的路径,data为要写入数据列表. file = open(filename, 'w') for i in range(len(data)): s =原创 2021-01-10 00:36:10 · 426 阅读 · 0 评论 -
Python爬虫学习之爬取财富快讯
import requestsfrom urllib.request import urlopen, Requestfrom bs4 import BeautifulSoupimport reheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.102 Safari/537.36'}#爬虫[Request原创 2021-01-09 23:52:26 · 362 阅读 · 0 评论 -
Python爬虫学习之爬取招聘信息并存入Excel
from urllib.request import urlopen, Requestfrom bs4 import BeautifulSoupimport xlwtimport jsonworkbook = xlwt.Workbook(encoding='utf-8')worksheet = workbook.add_sheet('My Worksheet')worksheet.write(0, 0, "序号")worksheet.write(0, 1, "工作名称")worksheet原创 2021-01-09 23:45:29 · 1136 阅读 · 1 评论 -
Python爬虫学习之爬取下载pdf文献
from urllib.request import urlopen, Requestfrom bs4 import BeautifulSoupimport osfrom urllib.request import urlretrieveurl = "http://cjc.ict.ac.cn/qwjs/No2020-01.htm"headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit原创 2021-01-09 23:39:33 · 1705 阅读 · 1 评论 -
Python爬虫学习之爬取百度图片并保存到本地
import json, re ,osfrom urllib.request import Request, urlopen, urlretrievedef json_all(pn): links = [] for i in range(0, pn+1): url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&logid=10112593352318188956&ipn=rj&原创 2021-01-09 23:35:11 · 631 阅读 · 0 评论 -
Python爬虫学习之爬取豆瓣音乐Top250存入Excel表格中
前言目标网站:https://music.douban.com/top250任务:爬取豆瓣音乐Top250的歌曲名爬取豆瓣音乐Top250的歌曲对应的表演者、发行时间和音乐流派(分别对应下图斜杠一行的第1个、第2个和最后1个)爬取豆瓣音乐Top250的歌曲对应的评分和歌曲详情链接将爬取到的数据依次写入Excel表格中打开网页 → 点击下一页 → 发现网站URL有所改变 → 再点击下一页 → 返回第一页 → 发现网址的规律https://music.douban.com/top250?s原创 2020-12-30 19:22:42 · 2290 阅读 · 2 评论