work3
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
21、机器学习模型相关知识解析
本文详细解析了机器学习模型相关知识,重点介绍了支持向量机(SVM)的特性与优势、模型工作室中各节点的功能、常见模型概念问答、数据挖掘操作流程、模型评估指标以及不同模型的优化方法。文章通过流程图和对比表格的形式,帮助读者更清晰地理解不同模型的特性与适用场景,为实际应用中选择和优化模型提供了实用指导。原创 2025-09-06 01:07:26 · 27 阅读 · 0 评论 -
20、SAS 数据处理与模型构建全解析
本博客全面解析了使用SAS进行数据处理与模型构建的关键知识,涵盖CAS服务器数据加载、矩阵基础知识、决策树分割搜索机制以及多种机器学习模型的构建与调优实践。通过详细的技术说明与操作步骤,帮助读者深入理解数据处理流程和模型优化策略,提升数据分析能力。原创 2025-09-05 16:46:16 · 50 阅读 · 0 评论 -
19、模型部署与Model Studio工具使用全解析
本文详细解析了在SAS Viya环境中使用Model Studio进行模型部署的流程与工具应用。从模型评分代码的生成,到多种模型部署方式的选择,全面介绍了如何通过Score Data节点、ASTORE过程、SAS Model Manager评分测试以及API调用等方式实现模型落地。同时,深入讲解了Model Studio中的各类实用工具,包括Save Data节点、SAS Code节点、Open Source Code节点等,并演示了如何将Python和R构建的开源模型集成到Model Studio项目中。原创 2025-09-04 14:43:56 · 73 阅读 · 0 评论 -
18、支持向量机模型构建、评估与部署全解析
本文全面解析了支持向量机(SVM)模型的构建、优化、评估与部署流程。从SVM模型的基本操作、超参数调优方法,到模型评估指标如准确率、ROC曲线、增益图和提升图,再到模型的部署与性能监控,内容涵盖了机器学习的完整工作流。同时,文中详细介绍了在SAS Visual Data Mining and Machine Learning环境中如何通过自动调优优化SVM模型参数,并使用模型比较节点和管道比较功能选择最佳模型。最后,通过图形化工具和评估指标,帮助读者深入理解模型性能,并实现高效部署与持续优化。原创 2025-09-03 16:43:22 · 102 阅读 · 0 评论 -
17、支持向量机模型的优化与解释性分析
本文深入探讨了支持向量机(SVM)模型的优化方法与解释性分析。首先介绍了SVM模型性能评估指标——平均平方误差(ASE),并详细说明了如何通过调整惩罚项、核函数和容差等关键超参数来优化模型性能。随后,文章重点分析了SVM的优化问题及其数学原理,包括最大间隔超平面、软间隔分类器和拉格朗日乘子法的应用。在模型解释性方面,文章介绍了部分依赖图(PD)、个体条件期望图(ICE)和局部可解释模型无关解释图(LIME)等工具,并通过实际案例展示了如何利用这些工具增强模型的可解释性。最后,文章总结了SVM模型优化与解释性原创 2025-09-02 11:00:31 · 37 阅读 · 0 评论 -
16、机器学习中的随机梯度下降与支持向量机
本文探讨了机器学习中的两种重要方法:随机梯度下降(SGD)和支持向量机(SVM)。SGD 是常用的优化算法,但存在需要大量手动调整超参数的问题,如学习率和退火率。文章介绍了如何通过正则化和自动调优技术优化神经网络模型的性能。同时,SVM 被介绍为一种灵活的分类和回归工具,能够通过寻找最大间隔超平面和使用核技巧解决非线性问题。文章还展示了如何在 Model Studio 中构建、调优和解释 SVM 模型。最终,根据具体任务选择合适的方法并优化超参数是提升模型性能的关键。原创 2025-09-01 11:55:24 · 30 阅读 · 0 评论 -
15、神经网络:运行、优化与学习
本文深入探讨了神经网络的运行、优化与学习过程,涵盖了神经网络的优缺点、复杂度控制方法、避免局部极小值策略、参数估计以及数值优化技术。文章还提供了神经网络建模的实际操作流程和应用建议,帮助读者更好地理解和应用神经网络模型,提高其预测性能和泛化能力。原创 2025-08-31 14:10:18 · 26 阅读 · 0 评论 -
14、机器学习模型:森林模型与神经网络模型解析
本文详细解析了机器学习中的两种重要模型:森林模型和神经网络模型。介绍了森林模型的构建步骤、优缺点以及优化方法,同时深入探讨了神经网络模型的结构、学习过程及改进策略。通过对比分析,帮助读者根据具体问题和数据特点选择合适的模型,并提供模型优化建议,以提升模型性能。原创 2025-08-30 14:28:06 · 41 阅读 · 0 评论 -
13、梯度提升与森林模型的深入解析及实践
本文详细解析了梯度提升决策树和森林模型的原理与实践应用。文章介绍了梯度提升通过迭代拟合残差来优化损失函数的核心思想,并探讨了参数自动调优的多种搜索方法,包括贝叶斯优化、遗传算法和网格搜索等。通过具体演示和实践操作,展示了如何在SAS Visual Data Mining and Machine Learning中构建和调优梯度提升与森林模型,并比较了不同参数设置对模型性能的影响。最终发现,通过合理的参数调整和自动调优技术,可以有效提升模型的预测精度和泛化能力。原创 2025-08-29 15:49:30 · 74 阅读 · 0 评论 -
12、机器学习中的超参数调优与决策树集成模型
本文深入探讨了机器学习中的超参数调优与决策树集成模型的应用。从超参数调优的基本方法(如参数扫描、随机搜索、参数优化)到SAS的自动调优功能,详细分析了如何通过优化参数提升模型性能。文章还介绍了决策树的剪枝优化、集成模型(如随机森林和提升方法)的基本原理与实践,以及模型评估的关键指标。结合实际案例,展示了超参数调优与集成模型在客户流失预测中的应用效果,并讨论了未来的发展趋势与挑战。本文旨在帮助读者更好地理解并应用这些关键技术,以构建更准确、更稳定的机器学习模型。原创 2025-08-28 11:47:08 · 54 阅读 · 0 评论 -
11、决策树模型的优化与参数调整
本文详细介绍了决策树模型的优化与参数调整方法。内容涵盖决策树的基础操作与初步评估,递归分区的原理及参数调整,包括基尼不纯度、熵和方差等分割标准;讨论了处理缺失值和评估变量重要性的策略;并深入解析了优化模型复杂度的方法,如预剪枝和后剪枝,以及自下而上剪枝的具体过程。最后总结了决策树优化的关键要点,旨在帮助读者构建更高效、准确的决策树模型。原创 2025-08-27 10:41:16 · 33 阅读 · 0 评论 -
10、决策树:原理、构建与优化
本文详细介绍了决策树的基本原理、构建过程及其优化策略。从决策树的分类和回归功能出发,讲解了如何通过分割选择、递归分区、剪枝等方法提高模型的预测能力。同时,讨论了决策树的优缺点以及如何通过参数调整和模型优化来提升性能。适用于希望深入了解决策树算法及其应用的读者。原创 2025-08-26 10:36:48 · 22 阅读 · 0 评论 -
9、机器学习数据处理与特征工程全解析
本文深入解析了机器学习中的数据处理与特征工程技术,涵盖缺失值处理、非结构化数据管理、特征提取与选择、变量聚类等关键技术。通过实际案例演示了如何在Model Studio中进行数据清洗、变换、文本挖掘和模型优化,旨在提升机器学习模型的预测性能和泛化能力。原创 2025-08-25 13:00:45 · 38 阅读 · 0 评论 -
8、机器学习算法选择指南
本文详细介绍了如何根据数据特征、模型目标、准确性要求、训练时间、可解释性及自动调优能力等因素选择合适的机器学习算法。涵盖了线性回归、逻辑回归、K近邻、决策树、随机森林、神经网络、支持向量机等常见算法的适用场景和优缺点,并提供了算法选择的决策流程和比较总结。此外,还讨论了实际应用中的注意事项,如数据预处理、参数调优和模型评估等,并通过一个预测房屋价格的案例展示了算法选择的具体过程。原创 2025-08-24 14:35:47 · 20 阅读 · 0 评论 -
7、模型部署中的数据处理与特征选择
本文详细探讨了模型部署过程中的数据处理与特征选择方法,包括对极端值的处理、变量变换、分箱、特征选择策略及变量聚类技术。文章通过实际案例演示了如何在SAS Model Studio中进行数据预处理和特征筛选,以提升模型性能和泛化能力。同时,针对高维数据和变量冗余问题,提出了相应的解决方案,并展望了未来优化方向。原创 2025-08-23 13:16:53 · 33 阅读 · 0 评论 -
6、数据特征提取与处理:从理论到实践
本文深入探讨了数据特征提取与处理的方法,从数据预处理、非结构化文本数据的挖掘与结合,到SVD、PCA、RPCA和自编码器等特征提取技术进行了系统分析。同时,还介绍了处理极端值、输入转换、特征选择以及变量聚类等关键技术,并通过实际演示展示了如何在Model Studio中完成数据处理和建模流程。文章为构建高效、准确的数据建模过程提供了理论支持和实践指导。原创 2025-08-22 15:23:02 · 24 阅读 · 0 评论 -
5、数据预处理:处理缺失值与非结构化数据
本博客重点探讨了数据预处理中的关键问题:缺失值处理和非结构化数据的处理方法。详细分析了缺失值的来源、带来的问题以及多种处理技术,包括删除行、均值插补、决策树插补和分箱等。同时,介绍了如何将非结构化数据(如文本数据)通过词袋模型和TF-IDF转换为机器学习可用的特征。此外,还讲解了使用奇异值分解(SVD)进行数据降维的原理和步骤。通过这些方法,可以有效提升数据质量和模型预测性能。原创 2025-08-21 12:09:38 · 50 阅读 · 0 评论 -
4、数据预处理与算法选择全解析
本文全面解析了数据预处理的最佳实践,包括处理不完整数据、高维数据、缺失值等问题的解决方案,并介绍了特征工程的核心技术和实现方法。同时,文章深入探讨了常见机器学习算法的选择策略,涵盖分类、回归、K近邻、聚类等算法的原理、适用场景及优缺点。通过流程图和表格形式,帮助读者系统化地理解如何根据数据特点和业务需求选择合适的建模方案。最后,结合实际案例,展示了从数据预处理到模型构建的完整流程,为读者提供了一套完整的机器学习实战指南。原创 2025-08-20 10:48:14 · 43 阅读 · 0 评论 -
3、数据准备与预处理全解析
本文详细解析了机器学习中的数据准备与预处理全过程,涵盖了数据探索、数据划分、稀有事件处理、数据预处理节点的使用等内容,并结合Model Studio工具进行了实践演示。文章旨在帮助读者掌握数据准备的关键步骤,理解各环节的重要性及注意事项,同时介绍了实践中常见问题的解决方案以及未来发展趋势,为构建高效、准确的机器学习模型奠定基础。原创 2025-08-19 15:53:00 · 57 阅读 · 0 评论 -
2、机器学习入门:基础概念与Model Studio实践
本文介绍了机器学习的基础概念,包括监督学习、无监督学习、半监督学习和强化学习的核心思想,以及监督学习的预测类型。随后详细讲解了如何使用Model Studio进行项目创建、数据加载、管道构建与模型分析。通过演示操作流程,展示了从模板创建管道、运行分析、模型评估与比较的完整过程,旨在帮助用户快速掌握机器学习实践技能。原创 2025-08-18 10:12:10 · 84 阅读 · 0 评论 -
1、大数据分析与机器学习:SAS Viya 实战指南
本文详细介绍了大数据分析与机器学习的核心概念及其在SAS Viya平台上的实战应用。内容涵盖了统计建模与机器学习的区别、创建优秀机器学习系统的关键要素、SAS Viya架构及其计算环境(如CAS、MPP、SMP)、Model Studio的使用流程,以及机器学习在欺诈检测、精准营销、金融风险管理和客户流失预测等领域的应用。此外,还探讨了SAS Viya中的性能优化策略与非确定性结果的处理。本书旨在帮助读者掌握利用SAS Viya进行高效数据分析和建模的方法,从而为企业决策提供数据支持。原创 2025-08-17 13:35:02 · 55 阅读 · 0 评论
分享