告别手动!n8n+Bright Data MCP 实现 LinkedIn 职位信息自动化采集

1.前言

在这里插入图片描述

在当今竞争激烈的就业市场中,及时获取最新的职位信息对于求职者和企业招聘都至关重要。LinkedIn 作为全球最大的职业社交平台,每天都有大量的职位信息更新。然而,手动抓取这些信息不仅效率低下,还可能错过重要的机会。因此,实现每小时自动抓取 LinkedIn 职位信息的自动化流程就显得尤为必要。本文将介绍如何利用 n8nBright Data MCP 工具来搭建这一自动化流程

2.Bright Data MCP 强大的地方

在这里插入图片描述

MCP 介绍:AI圈中的MCP是什么?

简单来说,MCP 就是网页与工具之间的转化器,方便形成工作流

  • 代理网络强: 拥有全球大量的住宅、数据中心和移动 IP,能轻松绕过 LinkedIn 等平台的反爬限制,让数据抓取持续稳定进行
  • 合规又安全: 严格遵守全球数据隐私法规(如 GDPR),从数据抓取到存储全程合规,有效保护用户数据和隐私安全
  • 数据管理方便: 提供完善的存储和管理功能,能快速对存储的职位信息进行查询、筛选和导出,方便后续分析使用
  • 可灵活扩展: 随着数据量增加和需求变化,能轻松扩大存储容量和代理资源,满足不同规模自动化流程的需求

除此之外,免维护代理池、自动解锁、自动处理 JavaScript 渲染,支持多种模式(RapidPro),可通过 URL 参数控制行为(如 unlockerbrowserpro=1),支持 ClaudeCursorLangChainn8n 等主流工具集成。这些都是 Bright Data MCP 的优点

拥有两种部署方式:

  1. 远程(托管)MCPBright Data 云端托管,无需自行搭建。远程 MCP 快速入门
  2. 本地(自托管)MCP:您可以在本地或私有云环境中部署。本地 MCP 快速入门

3. MCP + n8n 自动化流程 - 快速入门图文教程

3.1 前提准备

3.1.1 Bright Data 注册账号

在这里插入图片描述

传送门:亮数据

在这里插入图片描述

点开链接后,有个立即开始,点击他,自动弹出注册弹窗,填写信息注册一个 Bright Data 帐户(注册→ 2 分钟)

🔥注意: 亮数据平台对登录有要求限制

  • 在亮数据的中文网站上注册 bright.cn
  • 在自己的电脑上操作,而非手机上
  • 关闭 VPN
  • 关闭局域网

实在还无法解决的可以查看官方登录解决文档

3.1.2 Bright Data API获取

在这里插入图片描述

API密钥获取

点击链接进入 API 密钥获取界面,可能会弹出让你再次登录的界面,登陆即可

单击 API 密钥部分右上角的添加 API 密钥按钮

在这里插入图片描述

配置您的用户、权限和 API 密钥到期日期(或“无限制”),然后单击保存

在这里插入图片描述

然后就会的得到 API 密钥,将其复制下来保存好,后面会用到

🔥注意: 生成 API 密钥后,确保将其保存到本地安全位置,因为它只会显示一次!

3.1.3 本地部署n8n(可跳过)

3.1.3.1 docker环境准备

在这里插入图片描述

传送门:docker官网

打开官网主页后,如图选择对应的电脑版本,一般 Windows 都选的是 AMD64,后续跟正常下载安装软件一样就行,可能会要安装子系统,跟着操作来就行了

在这里插入图片描述

打开软件来到这个页面后进行注册

在这里插入图片描述

推荐谷歌和 githubqq 邮箱也可以有点小麻烦

在这里插入图片描述

登录之后,在设置里将存储路径修改一下,放在除 C 盘外空闲的硬盘里即可

3.1.3.2 n8n工作流本地部署

在这里插入图片描述

Docker Hub 搜索 n8n 找到对应的部署

在这里插入图片描述

选择 latest 最新版本进行 Pull 镜像,等待下载完成

在这里插入图片描述

传送门:n8n官网

点击这个 github 图标跳转到源代码处获取部署的代码

在这里插入图片描述

往下滑找到这里的代码并复制

在这里插入图片描述

回到 Images 这里等待下载完成后,点击运行

在这里插入图片描述

按照如图所示填写完成之后,点击 Run

在这里插入图片描述

出现这个网址就部署就成功了,点击进去进行 n8n 的账号注册即可

在这里插入图片描述

3.1.4 网页使用n8n(快捷)

在这里插入图片描述

传送门:n8n官网

点击 Get started 并注册账户就能获得 14 天免费试用,足够满足刚开始的需求,但是还想使用的话最好还是本地部署

在这里插入图片描述

3.2 Bright Data 对于 Linkedin 职位的数据收集

在这里插入图片描述

回到 Bright Data 的操作页面,在 Web Scrapers 处搜索 linkedin,选择第一个

在这里插入图片描述

选择 LinkedIn people profiles - collect by URL 收集数据

在这里插入图片描述

选择第一个爬虫 API

在这里插入图片描述

Overview 部分划到最下面的 Dictionary,可以查看职位数据收集的相关信息,如果还有想要添加的可以点击下面的 Request a new one

在这里插入图片描述

点击 API request builder 部分,在 Trigger Data Collection API 这里添加你想收集数据
Linkedin 职位公司页面,注意是有数量限制的,具体以实际为准

在这里插入图片描述

点击 Management APIs 部分,在 Delivery options 进行配送选项的配置

  • Download snapshot:数据临时存储下载
  • Deliver to storage:发送到阿里,谷歌的等云存储

文件格式我这里是 JSON,一般这个就行了,具体以实际需求为准

在这里插入图片描述

回到 API request builder 部分,复制右边配置好的命令行代码,选择 Windows CMD 进行本地运行

在这里插入图片描述

win + R 调出命令窗口,输入 cmd,打开命令行交互界面后粘贴刚才复制的命令行代码

🔥注意:

-H "Authorization: Bearer 你的API密钥"

Bearer 后面需要填写你刚才配置好的 API 密钥

在这里插入图片描述

ENTER 键运行后,显示出 snapshot_id 字样,说明数据已经抓取成功并临时存储了,复制这一串 id 保存起来

在这里插入图片描述

回到 Management APIs 部分,在 Delivery optionsSnapshot ID 这里填入刚刚获取到的id

在这里插入图片描述

复制该页面右边的命令行代码,等待 1 分钟数据集快照处理,按上面的方法再次运行

在这里插入图片描述

下面生成的一大堆数据集就是网页上爬取下来的职位示例信息,是不是操作很简单呢?想要可视化的数据的话可以让 AI 帮你整理

以上是简便的数据收集方法,如果需要频繁大量调用的话建议还是使用 python,方法和上面都是一样的,这里不再过多赘述

但是每次都要手动处理确实是麻烦,所以我们利用 n8n自动化工作流,实现定时自动收集

3.3 开始 Bright Data MCP + n8n 工作流创建

在这里插入图片描述

首先进行 Bright Data MCP 节点配置

在这里插入图片描述

点击设置

在这里插入图片描述

开启 n8n 社区节点,右下角 Sava changes 保存设置

在这里插入图片描述

然后 Create Workflow 创建一个工作流项目

在这里插入图片描述

Add first step 并搜索 BrightData,能显示就说明已经支持社区节点了

在这里插入图片描述

首先点击 Add first step 添加一个 On a schedule 的开始出发节点,这是个时间触发节点

在这里插入图片描述

设置为早上八点自动发送,Execute step 创建

在这里插入图片描述

接着点击 + 并搜索 http,增加一个网络请求节点

在这里插入图片描述

回到复制亮数据获取关于 Snapshot_ID 的代码

在这里插入图片描述

把这串代码放到 Import cURL,他会自动截取出来需要的部分

在这里插入图片描述

然后我们搜索并添加 Wait 节点,设置为 1 分钟,因为有时候可能收集数据过多,会导致传出空值而错乱

在这里插入图片描述

再次回到亮数据复制下载代码

在这里插入图片描述

我们再创建一个网络请求节点,把这串代码放到 Import cURL,他会自动截取出来需要的部分

在这里插入图片描述

随后添加一个 Limit 筛选输出的数据为 100 个,避免数据过多

在这里插入图片描述

最后工作流如图所示,点击 Execute workflow 执行

在这里插入图片描述

回到 Bright Data 处查看日志,自动下载成功了,Bright Data 的爬取搭配上 n8n 自动化确实是很方便,主要还是得益于 Bright Data 的快速安全爬取

如果还有 AI 整理,群发等要求,可以在 n8n 中进行节点配置

4.总结

Bright Data MCP 抓取数据的过程不需要自己手动写代码,它帮助我们完成了在云上向 Linkedin 发出 http 数据请求;模拟登陆、配置 IP 代理、动态访问、识别验证码、破解加密数据等 ;解析获取的 HTML,提取重要的字段,输出为 json 格式的过程。

相较于自己动手写代码爬虫,还需要不断调试的麻烦,这种一键抓取的方式大大降低了上手的门槛,零基础小白也能轻松使用!但配上 n8n 自动化更是画龙点睛

注册即享免费额度,快来立即注册并免费试用 Bright Data MCP 吧!( •̀ ω •́ )✧

传送门:https://get.brightdata.com/w-mcpserver

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值