- 博客(15)
- 收藏
- 关注
原创 Advanced Learning Algorithms Ⅳ
本文介绍了决策树的基本原理与应用。首先阐述了决策树的结构(根节点、决策节点、叶子节点)和构建标准(信息增益、熵)。然后详细讲解了如何处理不同特征类型(二元特征、多元特征、连续特征)以及回归问题中的方差应用。接着探讨了决策树集合方法(随机森林、XGBoost)及其优势,包括降低过拟合风险和提高预测稳定性。最后对比了决策树与神经网络的适用场景:决策树适合结构化数据且解释性强,神经网络则更适用于非结构化数据但训练成本较高。文章系统性地展示了决策树从基础概念到高级应用的完整知识体系。
2025-11-23 08:00:00
1806
原创 Unsupervised Learning
本文介绍了K-means聚类算法和异常检测两种无监督学习方法。K-means通过迭代优化数据到聚类中心的距离完成分组,需预先设定聚类数量K,并通过多次运行避免局部最优解。文章还展示了K-means在图像压缩中的应用实例。异常检测则利用高斯分布进行概率密度估计,通过设定阈值识别异常事件,并讨论了特征变换和误差分析等改进方法。最后对比了异常检测与有监督学习的适用场景:前者适用于异常样本少且类型多变的情况,后者适用于异常样本充足且类型固定的情况。
2025-11-23 07:00:00
681
原创 Advanced Learning Algorithms Ⅲ
本文探讨了机器学习模型性能优化的关键方法。首先介绍了数据集拆分的三种方式(训练集、验证集、测试集)及其重要性,指出三拆分可避免测试集污染并稳定评估结果。其次分析了高偏差和高方差的诊断方法,建议通过正则化参数调整和增加训练数据来改进模型。文章还详细阐述了误差分析的技巧,包括数据增强和合成数据等数据集扩展方法,并介绍了迁移学习的应用场景。针对倾斜数据集,提出了使用精确率、召回率和F1分数等评估指标的必要性。最后概述了机器学习项目的完整生命周期,强调模型部署后的持续监控与迭代优化。这些方法为提升机器学习系统性能提
2025-11-18 09:00:00
690
原创 Advanced Learning Algorithms Ⅱ
本文介绍了神经网络的编译与训练过程,重点解析了TensorFlow中的compile()和fit()函数参数配置。compile()需要设置损失函数、优化器和评估指标,其中优化器如Adam算法能自动调整学习率以加速收敛。训练时需关注数据集和迭代次数,同时介绍了不同激活函数的适用场景(如Sigmoid用于二元分类,ReLU用于隐藏层)。针对多分类问题,详细说明了Softmax函数和稀疏分类交叉熵损失函数的使用方法。文章还通过手写数字识别实例展示了代码实现,并解释了反向传播机制如何通过计算图高效计算梯度。最后比
2025-11-17 18:00:00
614
原创 Advanced Learning Algorithms Ⅰ
摘要:本文介绍了神经网络的基本概念与发展历程,从最初的生物学动机到现代深度学习算法的工程化转变。重点解析了两层神经网络的结构和数学表达式,包括前向传播和反向传播机制。通过"烤咖啡豆"的案例展示了TensorFlow实现神经网络推理的完整流程,比较了NumPy和TensorFlow在数据处理格式上的差异。文章还阐述了从神经元硬编码到优化Dense函数的神经网络内部实现过程,强调理解底层原理对调试和优化的重要性。
2025-11-11 09:30:00
731
原创 Supervised Machine Learning Ⅲ
逻辑回归是一种用于分类问题的机器学习方法,通过Sigmoid函数将线性模型输出映射为0-1之间的概率值。与线性回归不同,它采用负对数形式的凸函数作为损失函数,确保梯度下降法的有效收敛。决策边界的选择直接影响分类结果,可通过线性或高阶多项式灵活定义。为防止过拟合,可采用正则化方法调整代价函数,在保留特征的同时控制参数影响。本文还探讨了梯度下降优化、学习曲线监控及特征缩放等加速收敛的技术,并比较了欠拟合与过拟合的解决方案。实验部分展示了具体实现中的常见问题及解决方法。
2025-11-10 21:00:00
965
原创 Supervised Machine Learning Ⅱ
摘要:特征缩放能加速梯度下降法的收敛,通过调整不同特征的取值范围(如Z-score归一化)使等高线趋于圆形,避免参数更新时的震荡。特征工程包括特征选择和创造(如将长宽转为面积),多项式回归则通过特征幂次实现非线性拟合,但需注意高次项会增大特征缩放的重要性。学习曲线可监控算法收敛情况。
2025-11-03 09:00:00
409
原创 Supervised Machine Learning Ⅰ
本文介绍了机器学习的基本概念,重点阐述了监督学习和无监督学习的区别。监督学习通过训练数据学习输入到输出的映射关系,主要包括回归和分类两类;无监督学习则侧重于发现数据中的模式和结构,如聚类和降维。文章详细讲解了线性回归模型,包括模型构建、代价函数评估以及梯度下降优化方法。梯度下降作为重要优化算法,其原理是沿负梯度方向迭代更新参数,最终找到代价函数的最小值。文中强调了学习率选择的重要性,并指出批量梯度下降在每次迭代中使用全部训练数据的特点。
2025-11-02 23:34:35
442
原创 Git常用命令[小白入门]
本文介绍了Git的常用命令,适合初学者入门。首先,讲解了如何配置Git,包括查看全局用户名和邮箱。接着,介绍了初始化本地仓库、添加文件到缓存区、提交到本地仓库以及版本切换等基本操作。文章还详细说明了分支的创建、切换、合并和删除操作。此外,介绍了如何定义远程仓库、推送本地仓库内容到远程仓库,以及如何克隆、抓取和拉取远程项目。这些命令涵盖了Git的基本使用场景,帮助用户快速上手Git版本控制工具。
2025-05-12 11:30:49
421
原创 软件测试期末复习--单元-集成-系统测试
系统测试是将经过集成测试的软件作为计算机系统的一部分,与硬件、外设、数据等依赖资源结合,在实际运行环境下对计算机系统进行的一系列测试,目的是发现潜在缺陷,保证系统正常运行。验收测试是软件交付前、系统测试后的最终测试阶段,由客户或最终用户验证系统是否满足业务需求。(黑盒测试)
2025-04-29 13:06:55
914
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅