零基础建议可以先看python语法,然后看看《Python3 网络爬虫开发实战》
此为b站上北理爬虫的截屏笔记,每课的代码都在里面了,配合视频回顾
p17
p18
p19
可用devtool
p23
查看父亲节点
查看标签
p24 bs遍历
soup.body下面有5个节点
注意,不是同一个父节点不能平行遍历,只有body下的p标签可以
p25
prettify,使内容显示更加清晰
p27 信息标记方式
xml
有内容:<...>....<.../>
无内容:<..../>
注释:<!--...-->
Python爬虫实践:bs4, requests, re与scrapy教程

这篇博客是北京理工大学网络爬虫课程的笔记,涵盖了bs4, requests, re和scrapy的基础使用。内容包括:信息标记方式(如XML和YAML),提取URL,正则表达式操作,以及scrapy爬虫项目实例,特别是股票数据的爬取和优化。不过,由于时间推移,部分代码可能已失效。"
107848913,7452009,JavaScript实现全屏滚动优化,"['JavaScript', '前端开发', '全屏滚动', '用户体验', '事件处理']
最低0.47元/天 解锁文章
5727

被折叠的 条评论
为什么被折叠?



