手把手教你爬虫简单例子——持续爬数据关注回形针粉丝变化

本文链接：https://blog.youkuaiyun.com/withyan/article/details/118309416

本文介绍了如何使用Python爬虫获取B站UP主回形针的粉丝数据，通过访问API接口获取JSON数据并解析。随着回形针账号被封，文章提及爬取其他UP主数据的方法，强调合法使用爬虫的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

写在前面

回形针何许人也？这里只引用B站很多大V的精准评价——“狗粮养的”。通过不断创作科普类视频暗藏私货而争取来自美国 NGO 的狗粮。

再次强调，以上内容纯属引用。

爬虫数据来源

为了简单，首先需要找到接口地址，然后访问这个地址就可以得到 json 数据，再简单解析一下就好了。

找接口地址方法也比较简单，但是需要一些耐心，主要步骤如下：

访问主页：https://space.bilibili.com/258150656?from=search&seid=3765479080204689527
鼠标右键，选择检查，找到 Network
如图所示，接口文件就在箭头所指的内容中，去除一些 css js 文件后，慢慢就可以找到接口。如下图所示。

找到的连接地址如下：
https://api.bilibili.com/x/relation/stat?vmid=258150656&jsonp=jsonp

可以直接浏览器访问，如果安装了 json 插件，看起来更舒服一些。

在这里插入图片描述

python 代码

已经知道接口了，那么爬虫就非常非常简单了。3分钟自己想一下。

import requests
import json

def get_page(url):    #解析网页
    headers={
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.70 Safari/537.36'
    }
    try:
        r=requests.get(url,headers=headers)
#         print(r.json())
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.json()
    except Exception as e:
        print("error",e)
        return "ERROR"

url='https://api.bilibili.com/x/relation/stat?vmid=258150656&jsonp=jsonp'
cases_json=get_page(url)

print('粉丝数目为：',cases_json['data']['follower'])