熬夜协会会长
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
22、机器学习实战:概念、技术与应用全解析
本文全面解析了机器学习的实战应用,涵盖从基础概念到技术实现的全流程。内容包括MLOps协作资源、持续训练与评估机制、数据处理、特征工程、模型训练与部署等关键环节,并深入探讨了数据漂移与概念漂移对模型性能的影响。介绍了AutoML、Scikit-learn、Keras等主流工具和平台,结合广告销售预测、客户流失预测、欺诈检测等实际用例,提供了完整的代码示例和流程图。文章还详细阐述了模型评估指标、超参数调优策略及未来发展趋势,旨在帮助读者系统掌握机器学习项目落地的核心技能,提升团队协作效率与模型维护能力。原创 2025-09-29 01:25:37 · 29 阅读 · 0 评论 -
21、AI 旅程的下一步探索
本文深入探讨了AI旅程中的关键领域,包括处理非结构化数据(如图像和文本)的技术方法,生成式AI的发展与应用,可解释AI中的内在与事后解释技术(如排列特征重要性与集成梯度),以及MLOps在模型开发、部署与监控中的实践流程。文章还提供了学习资源和代码示例,并展望了未来AI在生成模型、可解释性、运维标准化及跨领域融合方面的发展趋势。原创 2025-09-28 09:11:42 · 35 阅读 · 0 评论 -
20、机器学习模型训练、调优与正则化实践
本文介绍了在BigQuery ML中进行机器学习模型训练、超参数调优与正则化的完整实践流程。内容涵盖特征处理(如分桶与特征交叉)、使用TRANSFORM子句集成预处理逻辑、线性回归与深度神经网络模型的构建,以及通过L1/L2正则化和dropout技术缓解过拟合问题。文章详细展示了如何配置超参数调优实验,比较了不同云平台(如Vertex AI、SageMaker、Azure ML)的自动化调优服务,并提供了评估与预测的最佳实践。最后通过流程图和表格总结了关键步骤与工具选择,帮助开发者高效构建泛化能力强的机器学原创 2025-09-27 15:22:43 · 30 阅读 · 0 评论 -
19、构建神经网络模型与超参数调优实战
本文详细介绍了在Keras和BigQuery ML中构建神经网络模型与进行超参数调优的实战方法。首先通过函数式API构建预处理层与DNN模型,并使用Keras Tuner进行贝叶斯优化实现高效调优;随后在BigQuery ML中利用SQL完成数据加载、特征分桶与交叉,并演示了自动超参数调优流程。最后对比两种方法的优劣,帮助读者根据实际场景选择合适的技术路径,提升模型性能。原创 2025-09-26 12:27:32 · 24 阅读 · 0 评论 -
18、汽车拍卖价格预测:特征工程、超参数调优与Keras模型改进
本文详细介绍了汽车拍卖价格预测的完整流程,涵盖特征工程、超参数调优及Keras神经网络模型构建。通过创建交叉特征如model_trim和color_interior,结合scikit-learn的ColumnTransformer与减半网格搜索,模型RMSE从3300以上降至2915.02。进一步使用Keras Functional API和预处理层重建特征工程,并借助Keras Tuner进行贝叶斯超参数优化,探索更优模型性能。文章为回归预测任务提供了端到端的建模实践方案。原创 2025-09-25 10:50:05 · 40 阅读 · 0 评论 -
17、提升自定义模型性能:二手车拍卖价格预测实战
本文通过一个二手车拍卖价格预测的实战项目,介绍了如何使用scikit-learn提升自定义模型性能。从数据加载与预处理、特征工程(如异常值处理、特征交叉)、模型构建与Pipeline封装,到使用GridSearchCV进行超参数调优,最终完成模型评估与Flask API部署,系统性地展示了机器学习项目的关键步骤。目标是将预测模型的RMSE控制在2000美元以内,满足业务需求,并为后续模型优化提供可扩展的流程框架。原创 2025-09-24 10:49:15 · 34 阅读 · 0 评论 -
16、利用Keras与Vertex AI构建机器学习模型
本文详细介绍了如何利用Keras与Vertex AI构建和训练机器学习模型。内容涵盖张量与计算图基础、使用Keras进行数据预处理、模型创建、编译与训练,并深入讲解在Vertex AI上部署自定义模型的完整流程。文章还分析了关键代码细节,总结了常见问题及解决方案,帮助开发者根据数据规模选择合适的训练策略,提升模型开发效率与性能。原创 2025-09-23 10:52:11 · 22 阅读 · 0 评论 -
15、机器学习模型评估与预测服务全解析
本文深入解析了机器学习模型的评估与预测服务全流程,涵盖测试集评估中的训练服务偏差问题及其解决方案,详细介绍了准确率、召回率、精确率和混淆矩阵等分类评估指标的应用。通过scikit-learn的Pipeline机制实现数据转换的一致性,并对比逻辑回归与Keras神经网络模型的构建、训练与预测过程。文章还提供了模型性能优化建议,包括数据增强、特征工程、超参数调优和正则化策略,帮助读者系统掌握从模型开发到部署的关键技术要点。原创 2025-09-22 14:45:40 · 36 阅读 · 0 评论 -
14、利用 Pandas 和 Scikit-Learn 进行特征转换与逻辑回归模型构建
本文详细介绍了如何使用Pandas和Scikit-Learn进行数据预处理、特征工程、逻辑回归模型构建、评估与优化,并实现模型的保存与实际应用。通过特征选择、独热编码、数据拆分、特征缩放等步骤,构建高效的客户流失预测模型,结合分类报告、网格搜索等方法提升性能,最终完成模型部署,适用于实际业务场景中的预测任务。原创 2025-09-21 15:17:47 · 23 阅读 · 0 评论 -
13、利用Python训练自定义机器学习模型
本文介绍了如何利用Python训练自定义机器学习模型进行电信行业客户流失预测。通过使用Pandas、Matplotlib和Seaborn对IBM Telco客户流失数据集进行数据探索与清洗,结合scikit-learn和Keras分别构建逻辑回归与神经网络分类模型,并完成模型评估与优化。文章涵盖了从数据预处理、特征工程到模型训练、调优的完整流程,帮助读者理解在实际业务场景中如何选择无代码、低代码或自定义代码解决方案,并掌握基于真实数据集的建模方法。原创 2025-09-20 12:36:18 · 26 阅读 · 0 评论 -
12、利用 BigQuery ML 构建神经网络模型进行能源生产预测
本文介绍了如何利用 BigQuery ML 构建深度神经网络模型进行能源生产预测。内容涵盖特征选择、模型训练与评估、激活函数的作用、隐藏层设计以及使用 Cloud Shell 查看云存储文件的实践操作。通过分析模型的过拟合与欠拟合问题,探讨了调整模型架构和正则化技术的应用,并提供了超参数调优、模型融合和实时预测的未来展望。结合流程图与实践建议,帮助读者系统掌握从数据准备到模型应用的完整流程。原创 2025-09-19 15:33:04 · 29 阅读 · 0 评论 -
11、机器学习中的线性回归建模与可解释性分析
本文深入探讨了在BigQuery ML中构建线性回归模型以预测能源生产的全过程,涵盖数据可视化、多重共线性问题、模型训练与评估、以及基于ML.PREDICT和ML.EXPLAIN_PREDICT的预测与可解释性分析。通过温度、压力、湿度等特征与能源产出的关系分析,展示了如何利用全局与局部解释技术理解模型决策,并讨论了特征选择对模型通用性的影响,为构建可解释、高性能的机器学习模型提供了实用指导。原创 2025-09-18 15:51:40 · 31 阅读 · 0 评论 -
10、BigQuery数据处理与线性回归模型特征选择
本文详细介绍了如何在BigQuery中处理查询结果并进行线性回归模型的特征选择。内容涵盖查询结果的保存方法、线性回归模型原理、模型评估指标RMSE、权重确定方法(正规方程与梯度下降),以及基于领域知识和统计方法的特征选择策略。通过Google Colab实现数据加载、描述性统计、相关矩阵计算与可视化,深入分析各特征与能源产量的关系。文章还探讨了特征的相关性、实际意义与独立性,并提出了结合特征工程和模型变体优化模型性能的未来方向。原创 2025-09-17 10:28:57 · 23 阅读 · 0 评论 -
9、机器学习模型部署与电力生产预测:从欺诈检测到线性回归
本文介绍了机器学习在实际业务中的两个应用案例:一是欺诈检测模型的部署与预测,涵盖端点配置、特征归因及成本控制;二是利用BigQuery ML构建线性回归模型预测联合循环发电厂的电力输出。内容包括数据集加载、探索性分析、数据清洗、模型训练、评估与预测,并探讨了特征工程、参数调优和模型改进策略。文章强调了数据质量与模型优化对预测准确性的重要性,展望了机器学习在能源等领域的广泛应用前景。原创 2025-09-16 15:54:34 · 30 阅读 · 0 评论 -
8、利用AutoML进行分类模型训练与评估
本文介绍了如何利用Google Cloud的Vertex AI AutoML进行分类模型的训练与评估,以解决金融交易中的欺诈检测问题。内容涵盖数据集导出、分类模型基础、关键评估指标(如准确率、召回率、精确率、F1分数、ROC AUC和PR AUC)的理解与应用、模型训练流程、性能评估及特征重要性分析。通过实际操作步骤和对比分析,帮助读者掌握在不平衡数据场景下构建高效分类模型的方法,并探讨了模型优化与多场景拓展的未来方向。原创 2025-09-15 16:29:22 · 52 阅读 · 0 评论 -
7、使用AutoML检测金融欺诈交易
本文介绍了如何使用Google Cloud的Vertex AI AutoML构建金融欺诈检测模型。通过分析高度不平衡的模拟交易数据集,详细阐述了从数据探索、模型训练、评估到部署与持续监控的完整流程。重点讨论了在欺诈检测中召回率等关键指标的重要性,并提供了使用AutoML进行分类建模、性能评估和生产部署的实用指导,帮助提升金融机构对欺诈交易的识别能力。原创 2025-09-14 10:54:05 · 40 阅读 · 0 评论 -
6、使用AutoML训练线性回归模型以预测销售
本文介绍了如何使用Google的Vertex AI平台通过AutoML训练线性回归模型,以预测不同媒体广告投入对销售的影响。内容涵盖数据准备、模型训练、性能评估、特征重要性分析、预测结果解读及业务问题回答,帮助用户在无需编码的情况下构建高效的预测模型,并利用预测区间支持业务决策。原创 2025-09-13 15:52:05 · 33 阅读 · 0 评论 -
5、自动化机器学习:从低代码框架到广告销售预测
本文介绍了低代码自动化机器学习(AutoML)框架的基本概念与应用,涵盖基于SQL的机器学习工具和开源AutoML库。通过Google BigQuery ML、Amazon Aurora/Redshift ML等云服务,以及AutoKeras、Auto-sklearn和Auto-PyTorch等开源框架,用户可快速构建机器学习模型。文章以广告媒体渠道销售预测为业务用例,详细展示了从数据探索、预处理到模型训练与部署的完整流程,并提供了在Google Colab中使用Pandas进行数据分析的具体步骤,帮助数据原创 2025-09-12 10:21:39 · 26 阅读 · 0 评论 -
4、机器学习框架与AutoML:简化模型开发的利器
本文深入探讨了机器学习框架与AutoML技术如何简化模型开发流程,尤其适合非专业编程人员快速构建和训练模型。通过介绍No-Code AutoML的应用场景、工作原理及主流云平台(如Google、Microsoft、Amazon)的解决方案对比,展示了AutoML在电信、制造、零售和医疗等行业的广泛应用。文章还以公用事业公司营销项目为例,详细说明了从数据准备到模型部署的完整流程,并分析了AutoML在提高准确性、降低门槛、缩短上市时间等方面的优势,最后展望了其未来发展趋势与挑战。原创 2025-09-11 14:44:12 · 34 阅读 · 0 评论 -
3、数据科学实践:从基础概念到项目实战
本文深入探讨了数据科学从基础概念到项目实战的完整流程。内容涵盖数据驱动决策的实际用例,如雨伞销售预测、心脏病防治、欺诈检测等,并详细介绍了定量与定性数据、结构化与非结构化数据的区别及常见文件类型。文章还讲解了批处理与实时处理模式,指导如何使用GitHub管理项目和Google Colab进行低代码AI开发,重点分析了数据质量问题及其处理方法,并通过多个行业案例总结了机器学习框架的选择与应用。最后提供了清晰的项目流程图与实施步骤,帮助读者系统掌握数据科学项目的全生命周期。原创 2025-09-10 12:11:55 · 19 阅读 · 0 评论 -
2、机器学习工作流与数据处理全解析
本文全面解析了机器学习工作流的十个关键步骤,涵盖从问题定义、数据收集与预处理、数据分析、特征工程到模型选择、训练、评估、测试、部署及维护的完整流程。通过雨伞销售等实际案例,深入浅出地介绍了各类机器学习问题类型及其适用场景,并探讨了AutoML和低代码工具在简化建模过程中的作用。文章强调数据驱动决策的重要性,为从业者提供了一套系统化的方法论,助力高效构建和维护机器学习解决方案。原创 2025-09-09 13:59:40 · 25 阅读 · 0 评论 -
1、《数据驱动机器学习决策:从基础到实践》
本文深入探讨了数据驱动的机器学习决策从基础到实践的全过程,涵盖人工智能与机器学习的基本概念、企业级ML工作流程、常用工具(如Python库、Jupyter Notebooks、Google Colab、Vertex AI AutoML和BigQuery)的应用场景,以及数据在业务决策中的核心作用。文章还分析了数据驱动决策的优势与挑战,并展望了未来ML在智能化工具、跨领域融合、模型可解释性和数据治理方面的发展趋势,适合业务分析师、数据分析师、学生及有志于成为公民数据科学家的读者快速入门并应用机器学习技术。原创 2025-09-08 15:39:58 · 23 阅读 · 0 评论
分享