- 博客(5)
- 收藏
- 关注
原创 一文吃透 Serverless:从概念、选型到落地最佳实践
*Serverless 并非“没有服务器”,而是让开发者对服务器“无感”。**平台负责资源调度、弹性伸缩、可用性与计费,开发者聚焦业务逻辑与事件处理。:以函数为最小单位,事件触发、按调用计费、自动扩缩。典型产品:AWS Lambda、Azure Functions、Google Cloud Functions/Run Functions,以及国内云的函数计算产品。
2025-08-11 17:09:17
1237
原创 AI 赋能的 Python 超强爬虫:crawl4ai 框架助力异步高并发与断点续传
本项目以“高效、健壮、易扩展”为核心原则,针对大规模网络小说分章节采集的实际需求,设计了一套异步驱动、分批并发、断点可续的爬虫架构。核心流程高度解耦:采集流程、异常处理、文件存储、进度管理均为独立函数和模块,利于维护与复用。并发与批量控制灵活:采用信号量与任务分组,有效兼顾性能与目标网站友好性。进度状态与正文数据分离存储:方便断点恢复和多任务管理。采集与输出顺序严格保证:保证章节数据一致性。│ 章节URL生成 │ ==> │ 异步采集任务池 │ ==> │ 批量写入输出 │▲ │。
2025-08-08 16:53:52
2795
原创 从原理到实战:MCP(Model Context Protocol)驱动下的智能模型生态
MCP 简介 - MCP 中文文档MCP 帮助你在 LLM 的基础上构建代理(agents)和复杂的工作流。持续增长的预构建集成列表,LLM 可直接使用灵活切换不同的 LLM 提供商和厂商在你的基础设施内安全地处理数据的最佳实践自动合规:企业级数据全程可追溯、敏感可控风险可控:异常事件自动报警,减少安全风险便于审计:满足金融、医疗、政府等行业对数据合规的严格要求。
2025-08-01 18:16:10
1106
原创 低代码 + AI 驱动:基于 n8n 与 Crawl4AI 的高效自动化爬虫工作流构建(Docker版)
由于我们启动容器的时候挂载的路径是D:\workstation\02.work_space\n8n\n8n_data -> /home/node/.n8n,是将本地的D:\workstation\02.work_space\n8n\n8n_data映射到容器中的/home/node/.n8n,所以如果我们想要在本地环境即宿主机(Windows/Linux/Mac)看到文件,还需要将data目录下的文件复制到/home/node/.n8n下面。),然后文件名字和字段同样指定为之前的task_id,防止重名。
2025-07-31 16:05:38
3170
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅