自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 Django:Python高效Web开发利器

Django是一个高效的Python Web框架,采用MTV架构模式(Model-Template-View)和DRY原则,提供ORM、自动化管理后台等核心功能。它支持快速项目创建、模型定义、数据库迁移和URL路由配置,内置用户认证、表单处理和REST框架集成。Django注重安全性,自动防护CSRF、SQL注入等漏洞,并提供缓存策略、数据库优化等性能提升方案。通过完善的文档和丰富的生态系统,Django成为构建安全、可扩展Web应用的理想选择。

2025-12-26 14:19:47 484

原创 机器学习算法04:SVC 算法(向量机分类)

SVC(支持向量分类)是基于SVM原理的分类算法,通过寻找最优分类超平面实现数据分类。其核心特点包括最大化分类间隔、引入松弛变量权衡误分类、利用核函数处理非线性问题。适用于小样本、高维数据和复杂边界分类场景。相较决策树和K近邻算法,SVC在处理非线性问题上更具优势,但计算复杂度较高、可解释性较弱。代码示例展示了如何使用Python的scikit-learn库实现SVC分类器,并评估模型性能。

2025-05-31 11:00:00 940

原创 机器学习算法03:聚类算法

聚类算法是一类重要的无监督学习方法,用于发现数据内在结构和规律。常见算法包括:划分聚类(K-Means、K-Medoids)、层次聚类(凝聚式、分裂式)、密度聚类(DBSCAN、OPTICS)和网格聚类(STING、WaveCluster)。评估指标分为外部指标(兰德指数、调整兰德指数)和内部指标(轮廓系数、Calinski-Harabasz指数)。应用场景广泛,包括市场细分、图像处理、生物信息学、异常检测和文本挖掘等。这些算法通过将相似数据分组,为数据分析提供有效支持。

2025-05-30 11:00:00 1432

原创 Python自动化测试从入门到实战:pytest 框架全面教学指南

本文全面介绍了Python自动化测试框架pytest的核心功能和应用实践。内容涵盖:pytest的安装配置、测试用例编写规范、核心特性(断言/Fixture/参数化/标记)详解,以及高级应用如测试覆盖率统计和报告生成。通过一个Flask Web应用测试案例,演示了pytest在实际项目中的使用方法。文章还提供了测试实践建议,包括保持测试独立性、合理使用Fixture等。pytest凭借其简洁语法、强大功能和丰富插件生态,能有效提升单元测试、集成测试等各类测试场景的效率和质量。

2025-05-29 16:11:22 2885

原创 挑战1024道算法题-0004寻找两个有序数组的中位数

摘要: 题目要求在O(log(m+n))时间复杂度内找出两个有序数组的中位数。核心解法是通过二分查找转换为寻找第k小的元素:比较两数组的第k/2个元素,排除较小者所在数组的前半部分,调整k值并递归处理剩余数组。当k=1时返回两数组首元素较小值,最终根据数组总长度的奇偶性计算中位数。该方法通过每次排除一半元素将复杂度优化至O(log(m+n)),空间复杂度为O(1)。示例代码通过双指针和递归分治实现这一逻辑。

2025-05-29 14:23:01 793

原创 机器学习算法02:随机森林算法

随机森林是一种基于Bagging思想的集成学习算法,通过构建多个决策树并综合其预测结果来提高模型性能。其构建过程包括随机抽样样本集、随机选择特征、独立训练决策树三个步骤,并利用袋外数据进行评估。该算法具有抗过拟合能力强、处理高维数据效果好、鲁棒性强和可并行化等优点,但也存在模型复杂度高、小数据集效果不佳等缺点。随机森林广泛应用于金融风险评估、医疗诊断、市场营销、图像识别和数据挖掘等多个领域,能有效处理复杂数据并提高预测准确性。

2025-05-29 10:00:00 2569

原创 挑战1024道算法题-0003无重复字符的最长子串

【摘要】本文介绍了求解字符串中最长无重复字符子串长度的滑动窗口算法。通过维护左右指针构成的窗口和哈希集合检测重复字符,算法能高效地找到最长子串。具体步骤为:右指针不断扩展窗口直到出现重复字符,左指针右移缩小窗口。时间复杂度为O(n),空间复杂度为O(字符集大小)。示例表明该方法能正确处理"abcabcbb"(输出3)、"bbbbb"(输出1)、"pwwkew"(输出3)等典型情况,有效区分子串与子序列。该算法适用于由字母、数字、符号等组成的任意字符

2025-05-29 09:36:35 957

原创 机器学习算法01:决策树算法

《决策树算法详解》全面介绍了这一重要的机器学习方法。文章首先阐述了决策树的树形结构特点,包括根节点、内部节点和叶子节点的功能。重点讲解了决策树的构建过程,详细说明了特征选择(信息增益、基尼指数等)、决策树生成和剪枝(预剪枝与后剪枝)三个关键步骤。文章分析了决策树的优缺点,指出其可解释性强、处理非线性数据能力突出,但也存在过拟合风险。最后列举了医疗诊断、金融风控等典型应用场景,展现了决策树算法的实用价值。全文系统性地介绍了从理论基础到实际应用的完整知识体系。

2025-05-28 11:00:00 938

原创 MCP服务实战-连接Mysql(sse模式):搭建你的第一个MCPserve(免费源码)

MCP服务端支持两种通信方式:标准输入输出(stdio)适用于本地高效通信,HTTP服务器推送事件(SSE)适合远程调用。文章推荐使用MCPServer平台(mcp.so),并详细演示了如何用Python搭建MySQL-MCP服务器,包括配置环境、实现四种SQL工具方法(执行SQL、查询表名/结构、获取锁表信息)。通过CherryStudio客户端测试验证,展示了MCP在连接AI模型与业务系统(如MySQL、CRM等)中的灵活应用价值。

2025-05-27 10:42:20 2720 4

原创 机器学习实战04:基于支持向量机(SVM)模型的户外烧烤天气预测

本项目旨在通过历史天气数据预测布达佩斯是否适合进行户外烧烤。首先,对天气数据进行预处理和探索性分析,包括数据读取、特征工程和数据可视化,以揭示温度、湿度等气象指标的季节性规律。接着,通过随机过采样处理数据不平衡问题,并对特征进行归一化处理。随后,构建并评估支持向量机(SVM)模型,模型准确率达到约85%。关键分析显示,温度与烧烤天气呈正相关,湿度呈负相关。最后,总结了模型的性能,并提出了未来优化方向,如特征工程优化、模型调参和集成学习等。该项目展示了机器学习在生活场景中的实际应用价值,为户外活动规划提供了科

2025-05-17 12:00:00 1021

原创 机器学习实战03:基于决策树算法通过天气预测户外活动

本项目利用决策树算法,通过分析天气条件(如天气状况、温度、湿度和风力)来预测是否适合进行户外活动(Play)。首先,使用pandas库读取CSV格式的天气数据,并通过LabelEncoder和OneHotEncoder对分类特征进行编码转换。接着,将处理后的特征与目标标签(Play)分离,并利用scikit-learn中的DecisionTreeClassifier构建和训练决策树模型。通过可视化决策树,可以清晰地看到模型如何根据天气特征进行决策。项目展示了完整的机器学习流程,强调了数据预处理和特征工程的重

2025-05-16 15:00:55 1355

原创 机器学习实战02:学生成绩预测与可视化分析

本文通过一个机器学习项目,分析了影响学生数学成绩的因素,并利用多种模型进行成绩预测。项目首先使用Python的pandas库读取学生成绩数据,并通过可视化工具如热图、折线图等,探索了性别、种族、父母教育水平、测试准备课程等因素与成绩的关系。接着,数据经过预处理后,使用线性回归、决策树回归、随机森林回归等模型进行训练和评估,最终通过交叉验证和R²分数等指标比较模型性能。结果表明,父母教育水平和测试准备课程对成绩有显著影响,且随机森林回归模型表现最佳。

2025-05-15 10:00:00 1083

原创 机器学习实战01:预测信用卡逾期风险

本项目的主要目标是构建一个机器学习模型,基于客户的个人信息、历史还款记录等多维度特征,预测客户在下个月是否会发生逾期还款行为

2025-05-14 09:46:40 1339

原创 基于 PyTorch 的权限授权时间预测模型

通过本文的介绍,我们展示了如何使用 PyTorch 构建一个权限授权时间预测模型,并结合因果分析探索权限操作与授权时间之间的因果关系。

2025-05-07 13:54:25 1079

原创 Mac安装配置Visual Studio Code以及配置Anaconda-python环境

在扩展 中搜索第一个跟第五个安装,安装成功后重启。同样点击Download for macOS。点击Download for macOS。终端输出hello即全部安装配置成功。进入anaconda官网下载安装包。qq技术交流群:710962762。如果输出版本号即安装成功。同样全部默认选项安装。

2025-05-04 13:45:55 5212

原创 基础爬虫教程2:使用requests库实现简单的模拟登录爬虫

通过本教程,你可以学会如何使用requests库实现简单的模拟登录爬虫,并获取目标数据。希望这篇教程对你有所帮助。

2025-05-01 09:00:00 1588

原创 进阶爬虫实战1:自动化爬取招聘网站职位信息

如何使用DrissionPage库实现自动化爬取

2025-04-30 09:58:54 1258

原创 基础爬虫实战1:登录古诗文网并获取页面数据

在网络数据获取的领域中,爬虫是一种强大的工具。今天我们将通过一个实际的例子 —— 登录古诗文网并获取相关页面数据,来学习基础的爬虫知识。

2025-04-30 09:03:07 1490 1

原创 Dify访问宿主机milvus服务遇到Fail connecting to serve报错

dify访问宿主机milvus服务遇到报错Fail connecting to serve

2025-04-22 16:49:06 718

原创 dify代码执行导包遇到:Operation not permitted报错

问题:权限限制虽然官方沙箱有很多权限设置,是更好的沙箱解决方案,但在 Dify 的代码节点完全自行编辑的个人使用案例中,不存在代码注入的风险。该项目旨在为更多依赖项(如 numpy>2.0、matplotlib、scikit-learn)提供更广泛的权限和支持,以减少令人困惑的错误消息。此代码是通过引用官方沙箱的 API 调用示例开发的。如何解决然后修改 中的 sandbox 镜像以使用。

2025-04-22 14:03:55 4264 7

原创 挑战1024道算法题-0002两数相加

给你两个的链表,表示两个非负的整数。它们每位数字都是按照的方式存储的,并且每个节点只能存储数字。请你将两个数相加,并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外,这两个数都不会以 0 开头。

2025-04-21 16:14:22 398

原创 挑战1024道算法题-0001两数之和

给定一个整数数组nums和一个整数目标值target,请你在该数组中找出target的那整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答案,并且你不能使用两次相同的元素。你可以按任意顺序返回答案。

2025-04-21 15:53:31 643

原创 基于大模型与milvus库构建简单的输入查询迭代器

基于大模型与milvus库构建简单的输入查询迭代器

2025-04-17 14:44:47 572

原创 基于ollama本地模型处理数据生成嵌入向量插入进milvus向量数据库

博主使用ollama调用gte-large-zh:latest模型处理json数据,生成嵌入变量,并存储进milvus向量数据库中。

2025-04-17 11:04:07 711

原创 如何在本地部署milvus服务器(无需docker)

关于我在windows想使用milvus库,又不想麻烦的部署docker,所以总结了如何在本地部署milvus服务器。

2025-04-16 16:53:54 2900 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除