- 博客(13)
- 收藏
- 关注
原创 帕尔默企鹅数据集项目分析
本文基于帕尔默企鹅数据集,运用五种机器学习算法进行企鹅物种分类研究。首先对数据进行预处理和可视化分析,包括企鹅物种、岛屿分布、喙部与鳍部特征等单维度及多维度分析。随后采用逻辑回归、支持向量机、K邻近、随机森林和梯度提升等模型进行分类预测,其中随机森林和梯度提升模型表现出最优性能(准确率最高),而K邻近算法准确率最低。研究还通过特征重要性分析识别出影响分类的关键特征。该实验为数据科学初学者提供了完整的分类建模流程参考。
2025-06-01 16:52:34
1204
原创 共享单车需求项目分析
本文基于Kaggle共享单车需求预测项目,使用历史租赁数据和天气数据预测华盛顿特区的自行车租赁需求。研究采用三种机器学习方法(集成学习、XGBoost和神经网络)建立预测模型。通过数据预处理,将日期拆分为年、月、日、小时等特征,并进行可视化分析发现:天气因素(温度、湿度)、时间特征(月份、小时)显著影响租赁量。特征工程保留了9个关键特征,包括离散变量的独热编码。模型评估表明,梯度提升树等集成学习方法表现良好。该项目为共享单车运营提供了数据支持,有助于优化资源配置。
2025-05-31 10:41:09
1905
原创 Titanic人员生存预测
Titannic是kaggle最受欢迎的竞赛项目之一,它的数据集包含泰坦尼克号上的乘客详细信息,信息涵盖很多方面。竞赛要求很简单:使用机器学习来创建一个模型,该模型可以预测哪些乘客在泰坦尼克号沉船事故中幸存下来。本文参考了网上各种实现代码,使用sklearn机器学习库编码实现了三种分类器算法:随机森林分类器、K近邻分类器和支持向量机分类器。并对三种分类器算法的识别率进行了比较分析。我们使用的编程语言是python,版本号是3.8.8。
2025-05-18 09:04:30
1061
原创 基于MNIST的手写体数字识别
MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片。它也包含每一张图片对应的标签,告诉我们这个是数字几。作为kaggle上机器学习入门级别比赛,手写体数字识别是最基本的一个。这里所用的数据为MNIST提供的0-9的手写体数字,kaggle上提供了csv格式的数据文件,可以直接读取。手写体数字识别采用监督学习的方式。监督学习是通过已有的训练样本(即已知数据及其对应的输出)去训练得到一个最优模型,再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的。
2025-05-17 16:33:47
733
原创 深入解析测试用例编写:从理论到实战
本文详细介绍了测试用例编写的全过程,包括需求分析、测试策略选择、测试用例设计、编写与评审。强调了测试用例的重要性,如明确测试目标、提高测试效率、保障软件质量等。通过等价类划分法、边界值分析法等多种设计方法,结合实际案例,展示了如何编写高质量的测试用例。同时,提出了基于用户需求、结合开发文档、关注异常情况等编写技巧,帮助测试人员提升技能,确保软件质量
2025-04-27 09:54:47
1445
1
原创 性能测试专题:从基础到实战
本文深入探讨了性能测试的全方位内容,涵盖基础概念、重要性、分类、执行流程及实战案例。性能测试通过模拟用户操作与系统负载,检测软件系统的响应时间、吞吐量、资源利用率等关键指标,旨在评估系统性能、发现瓶颈并优化。文章详细介绍了五种测试分类:基准测试、负载测试、压力测试、容量测试和可靠性测试,并解析了响应时间、吞吐量等核心指标。结合电商系统实战案例,展示了从需求分析到优化验证的完整测试流程,还讲解了性能测试报告的生成方法。本文旨在帮助读者全面掌握性能测试要点,提升实际工作中的测试能力。
2025-04-01 15:34:22
779
原创 CocoaPods工具的介绍
CocoaPods是一个用于管理ios和macmos项目依赖的工具,它通过一个名为podfile的配置文件来管理项目所需要的第三方库,本文主要从定义,常用命令和安装来介绍这个工具
2025-03-10 18:20:55
773
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅