R语言爬取imdb电影海报

本文讲述了如何使用R语言的rvest和downloader库来爬取IMDb网站上的电影海报,以及如何处理爬取过程中遇到的问题,如图片质量、页面链接的获取和下载。作者还分享了爬取的数据,并提供了部分数据样本。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

提前声明,这不是一个好的例子,所以不要向我学习。让我先冷静一下!


OK,开始,今天我们开始从下面链接爬虫。

http://www.imdb.com/search/title?count=100&release_date=2016,2016&title_

type=feature打开页面如下:总共有100页,包含电影1万多部。我只爬取了2000个。PS:等我截下面这张图时顺序已经和原来的不一样了

这个页面已经显示海报了,但是爬出来之后图片太小,也太模糊,不能满足我的需求,因此继续爬出电影主页链接。进去之后页面如下,海报大小质量还算可以基本能满足我的要求,如下图。因此第一步就把爬取电影主页链接。(有没有看见妹子在盯着你)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值