基于n8n指定网页自动抓取解析入库工作流实战

1. 效果预览

给定华尔街见闻指定链接,自动抓取文章存储至MongoDB


2. 部署n8n

n8n可用插件非常多,并且完全免费开源

下载n8n后,执行npx n8n运行即可,如果node版本低于14会报错,请升级至20版本

3. firecrawl节点安装

3.1 其他节点介绍

第一节点用于 接收聊天输入
第二个节点用于判断是否为链接:我们可以直接拖动chatInput到蓝色字体处,然后选择正则表达式匹配url
IF 判断是否为Url
第三个节点是社区节点FireCrawl,我们首先需要安装下:

3.2 安装FireCrawl Node节点

点击

在IF节点后,我们添加FireCrawl节点,配置如下,


其中FireCrawl API配置如下, 改为自己的key

4. 格式转换节点配置


我们搜索Set, 新增字段编辑节点,将抓取的内容转为MongoDB需要保存的字段格式

5. MongoDB存储

定义好字段后,可以直接执行,在页面非常方便的看到输入与输出

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

算法小生Đ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值