- 博客(1)
- 收藏
- 关注
原创 简单的写一个爬虫代码(多线程实现爬取哈趣影视100页实例)
举个例子,我们可以发现title 在class="pull-left introduct_box"下面的h1里的a标签里面,我们可以获取他的text,也可以直接拿title=" "里的信息。本次爬虫使用的是Beautifulsoup解析,通过获取一级页面的href存入一个列表,在通过遍历这个列表的href获取二级网页并发起请求,获取二级页面里面每部电影的详细信息,并使用多线程爬取前100页,感兴趣的朋友们可以看看,代码简单易懂,本人也是初学者,有写的不好的地方欢迎大佬指正!
2023-09-20 20:37:18
1116
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人