- 博客(3)
- 收藏
- 关注
原创 Selenium解决动态渲染页面----爬取网易云音乐全部评论
import requests from bs4 import BeautifulSoup #URL url = 'https://music.163.com/#/song?id=1405283464' #请求头 headers = { "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (...
2019-12-18 20:36:26
713
原创 爬取豆瓣 TOP250 电影排行榜
很多朋友在看一部电影前都喜欢先找一下网友们对该片的评价。国内的电影评分网站,要数豆瓣最出名。接下来我们将爬取豆瓣至今TOP250的电影的详细信息。 豆瓣有专门一个 TOP250 的电影链接 -> https://movie.douban.com/top250 首先我们模拟浏览器发送请求,将数据保存为html网页格式,查看返回数据是否正常。 import requests from bs4 ...
2019-11-30 16:27:44
3650
3
原创 爬取百度新闻标题和链接
import re import requests from lxml import etree url = 'http://news.baidu.com/' #请求头 headers = { "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/...
2019-11-21 18:57:48
4806
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅