机器学习
文章平均质量分 82
hnmpf
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Dify之插件开发之Crawl4ai 爬虫打包与发布
本文介绍了如何将调试完成的Dify爬虫插件进行打包与发布。首先使用"difypluginpackage"命令对插件进行打包,生成.difypkg格式的插件包。接着说明如何将打包好的插件导入Dify平台,包括可能遇到的签名验证问题及其临时解决方案(修改.env文件添加FORCE_VERIFYING_SIGNATURE=false)。最后提到后续将讲解更安全的插件签名导入方式。文章提供了从插件打包到导入Dify平台的完整流程指南。原创 2025-09-01 15:10:01 · 1190 阅读 · 0 评论 -
Dify之插件开发之Crawl4ai 爬虫(简单逻辑实现)
本文介绍了基于Crawl4ai开发的网页爬虫插件实现过程。通过配置CrawlerRunConfig设置爬取深度(2级)、域名限制和最大页面数,使用FilterChain实现URL过滤功能。核心逻辑包括:1) 通过deep_crawl_url函数获取目标网页内容;2) 使用正则表达式提取符合条件的HTML链接;3) 通过关键字参数uRLPatternFilter进行URL过滤。插件支持批量URL爬取和关键字过滤,采用协程实现异步处理。开发完成后,可通过Dify工作室进行测试验证。整个实现封装在crawl4ai原创 2025-09-01 14:31:55 · 1744 阅读 · 0 评论 -
Dify之插件开发
本文介绍了如何将Crawl4AI网页爬虫开发为Dify插件的过程。主要步骤包括:搭建Dify插件模板环境(Windows系统)、创建插件模板(Python语言)、开发插件逻辑(实现爬虫功能)、调试部署(通过VSCODE和Anaconda环境)。重点说明了工具参数配置(yaml文件)和核心逻辑实现(Python类),并提供了调试过程中常见问题的解决方案。该插件支持URL过滤功能,可将爬虫服务集成到Dify工作流中,实现定制化数据采集。原创 2025-08-28 11:43:24 · 1616 阅读 · 0 评论 -
分享一个基于python的机器学习识别简单验证码的算法
注:源码基于Willson Luo的样例扩展而来,本文只做学习借鉴使用# -*- coding: utf-8 -*-from PIL import Imageimport osimport requestsimport timeimport cv2from sklearn import svmfrom sklearn.model_selection import t...原创 2019-02-28 17:26:54 · 850 阅读 · 0 评论
分享