基于n8n指定网页自动抓取解析入库工作流实战

1. 效果预览

给定华尔街见闻指定链接,自动抓取文章存储至MongoDB


2. 部署n8n

n8n可用插件非常多,并且完全免费开源

下载n8n后,执行npx n8n运行即可,如果node版本低于14会报错,请升级至20版本

3. firecrawl节点安装

3.1 其他节点介绍

第一节点用于 接收聊天输入
第二个节点用于判断是否为链接:我们可以直接拖动chatInput到蓝色字体处,然后选择正则表达式匹配url
IF 判断是否为Url
第三个节点是社区节点FireCrawl,我们首先需要安装下:

3.2 安装FireCrawl Node节点

点击

在IF节点后,我们添加FireCrawl节点,配置如下,


其中FireCrawl API配置如下, 改为自己的key

4. 格式转换节点配置


我们搜索Set, 新增字段编辑节点,将抓取的内容转为MongoDB需要保存的字段格式

5. MongoDB存储

定义好字段后,可以直接执行,在页面非常方便的看到输入与输出

### n8n 工作流配置使用指南 #### 1. 环境准备 为了成功配置和使用 n8n,需先安装 Docker 和 Docker Compose。这是因为在实际生产环境中推荐通过 Docker 来部署 n8n[^3]。 创建一个持久化存储卷来保存工作流配置和其他关键数据: ```bash docker volume create n8n_data ``` 启动 n8n 容器并将其绑定到本地端口 `5678` 上: ```bash docker run -d --name n8n \ -p 5678:5678 \ -v n8n_data:/home/node/.n8n \ docker.n8n.io/n8nio/n8n ``` 此命令会以后台模式运行容器,并确保即使容器被删除,数据仍然可以通过 `n8n_data` 卷保留下来[^3]。 #### 2. 访问 Web UI 并初始化设置 首次启动完成后,在浏览器中输入地址 `http://localhost:5678` 可进入 n8n 的图形界面。默认情况下无需密码即可登录,但在正式环境下应立即更改默认凭证以增强安全性[^3]。 #### 3. 构建基本工作流 n8n 中的工作流由多个 **节点 (nodes)** 组成,每个节点表示特定的服务或功能。以下是构建简单工作流的一般方法: - 添加触发器(Trigger Node),例如定时执行的任务或者监听某个 API 请求。 - 连接后续处理逻辑的节点,比如发送邮件、上传文件至 Google Drive 或更新数据库记录等。 - 测试整个链条的功能验证无误后再投入实际应用当中去。 具体操作步骤如下所示: 1. 在左侧菜单栏找到合适的 Trigger 类型拖拽放置于画布中央; 2. 设置好该 trigger 所需的各项参数选项; 3. 同样方式添加其他业务环节对应的 action nodes 到 canvas 上面并与前序 step 关联起来形成完整的 flow path 图形结构; 4. 最终点击右上方 “Execute Workflow” 按钮手动测试一遍整体流程效果如何。 #### 4. 自定义扩展能力 除了内置丰富的插件外,还可以利用 JavaScript 编写脚本来自定义某些复杂场景下的行为表现形式[^1]。对于更高级别的需求,则可能涉及到开发新的 custom node 插入进来满足特殊用途的要求。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

算法小生Đ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值