人脸相关项目,人脸数据是基本,也是比较麻烦的,最近在进行人脸数据采集的时候,发现了一个很实用的外文网站。
于是针对该网站进行分析。爬取相应的人脸数据。
1、首先,获取所有的页面列表
通过对网站内容的分析,发现该网站已经实现了按名字首字母的分页。形式如下
https://celebs-place.com/photos/people-A.html
https://celebs-place.com/photos/people-B.html
https://celebs-place.com/photos/people-C.html
...
展示如下:

2、解析名称列表
这么多人物,不可能一个个输入。要考虑自动解析。
通过对https://celebs-place.com/photos/people-A.html网页内容分析,发现人物名称保存在如下页面内容中

于是,便获取相应页面内容,并解析
url = 'ht

最低0.47元/天 解锁文章
1617

被折叠的 条评论
为什么被折叠?



