
python爬虫
文章平均质量分 65
练习爬取不同网页
INVinci_BY
微信公众号:你好不吃虾
发布AI最新咨询【大模型方向】
展开
-
Python简单操作爬取微博热搜榜(表格.xls模式存储)
爬取热搜榜需要重点注意的是:这里的代码是先划区分类——把标题,链接和点击数划分在一个大的集合里,存储的时候再分开。注意提取数据的方式soup.select。requests用于将链接转化成html语言,BeautifulSoup则用于查找需要的内容。通过采用soup.select()方法,可以得到所需的内容。其中关键点在于,对于所需内容的精准定位,通过()内的语句来实现:# -*- coding = utf-8 -*-# @Time : 2021/2/22 20:04# @Author :原创 2021-02-23 13:35:21 · 1604 阅读 · 6 评论 -
详细解读Python豆瓣电影Top250网页爬取(主要对re的运用&excel保存数据)//包括对库的简介
python里面有很多操作都类似于c语言,这里在爬取时主要需要注意用到的是for循环语句和各种库。 个人认为python中主要还是对库的运用比较占大比例。 (这里的版本是python3,软件是PyCharm) 所以,在爬取前先把这里所需要用到的库展示出来:from bs4 import BeautifulSoup #网页解析,获取数据import sysimport xlwt #进行excel操作import re #正则表达式,进行文字匹配import u原创 2021-02-22 18:56:23 · 1587 阅读 · 5 评论