y7z8a
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
35、《Pandas与AWS SageMaker使用指南》
本文详细介绍了如何使用Pandas进行数据处理,包括缺失值处理、排序和分组操作,并结合AWS SageMaker平台讲解了如何创建带GPU的笔记本实例、训练模型以及合理管理资源以控制成本。同时提供了综合案例与最佳实践,适用于希望在云平台上进行机器学习开发的开发者。原创 2025-08-31 09:45:40 · 50 阅读 · 0 评论 -
34、Pandas入门指南:数据结构与操作全解析
本文是一篇Pandas入门指南,全面解析了Pandas库中的核心数据结构(如DataFrame和Series)及其操作方法。内容涵盖数据的创建、访问、过滤、字符串处理、汇总统计以及性能优化技巧,帮助读者快速掌握使用Pandas进行表格数据处理与分析的核心技能。原创 2025-08-30 12:37:12 · 36 阅读 · 0 评论 -
33、NumPy 入门:操作与线性代数基础
本文详细介绍了 NumPy 的核心操作和线性代数基础,包括总结操作(如 sum、mean、max 等)、排序、数组重塑与组合、切片与过滤,以及向量与矩阵的乘法、矩阵求逆和正规方程等线性代数运算。通过一个线性回归模型的综合示例,展示了如何在实际问题中应用这些操作。同时,还提供了内存管理、性能优化和错误处理等方面的实用技巧。适合初学者和希望提升数据处理与科学计算能力的读者。原创 2025-08-29 12:22:15 · 76 阅读 · 0 评论 -
32、Python与NumPy入门指南
本文是一篇Python与NumPy的入门指南,涵盖Python包的管理、程序执行方式、NumPy数组的创建与操作、线性代数基础及其在机器学习中的应用。内容适合初学者了解Python和NumPy的核心功能,并为实际应用打下基础。通过示例代码和流程图,帮助读者快速掌握数值计算和数据处理的关键技能。原创 2025-08-28 13:35:22 · 36 阅读 · 0 评论 -
31、Python编程基础:变量、控制流、集合与代码复用
本博客详细介绍了Python编程的基础知识,包括变量与字符串格式化、控制流语句(if、for、while)、集合类型(列表、元组、集合、字典)及其操作、列表推导式的使用,以及如何通过函数和类实现代码复用。此外,还涵盖了模块导入和库安装的基本方法,帮助读者编写高效、简洁且易于维护的Python代码。原创 2025-08-27 12:38:05 · 104 阅读 · 0 评论 -
30、AWS 环境搭建与 Python 基础入门
本文详细介绍了AWS环境的搭建与Python基础入门。涵盖AWS账户设置、EC2实例创建与管理、计费信息访问配置、AWS CLI配置以及Python变量和元组操作等内容。通过清晰的操作步骤和代码示例,帮助读者快速上手AWS服务与Python编程,为后续项目开发奠定基础。原创 2025-08-26 11:26:33 · 55 阅读 · 0 评论 -
29、技术环境搭建与工具使用指南
本博客详细介绍了在不同操作系统(Windows、macOS、Linux)上搭建技术环境及配置相关工具的步骤,包括 Python 和 Anaconda 的安装、Jupyter Notebook 的运行与远程配置、Kaggle CLI 的使用、Git 源代码管理、Docker 安装,以及如何在 AWS 上租用 EC2 服务器。这些内容为开发者和数据科学学习者提供了全面的环境搭建与工具使用指南。原创 2025-08-25 13:41:33 · 33 阅读 · 0 评论 -
28、使用 Kubernetes 和 Kubeflow 部署与服务机器学习模型
本文介绍了如何使用 Kubernetes 和 Kubeflow 部署与服务机器学习模型。内容涵盖使用 Kubernetes 部署深度学习模型、Kubeflow 及其组件的简介、使用 KFServing 部署 TensorFlow 模型的具体步骤,以及通过变压器实现预处理和后处理的方法。此外,还提供了测试部署模型的代码示例,并讲解了实验结束后如何清理资源。原创 2025-08-24 15:24:47 · 45 阅读 · 0 评论 -
27、使用Kubernetes和Kubeflow部署模型
本文详细介绍了如何使用Kubernetes和Kubeflow在AWS EKS上部署机器学习模型服务。内容涵盖Kubernetes基础概念、创建EKS集群、准备Docker镜像、部署TF-Serving和Gateway服务,以及部署后的测试和优化建议。通过本教程,读者可以掌握在生产环境中高效部署和管理模型服务的完整流程。原创 2025-08-23 14:43:52 · 44 阅读 · 0 评论 -
26、使用 Kubernetes 和 Kubeflow 部署模型服务
本文介绍了如何使用 Kubernetes 和 Kubeflow 部署深度学习模型服务。文章详细描述了服务架构设计,包括网关和模型的分离,以及各自的功能和优势。此外,还涵盖了将 Keras 模型转换为 TF Serving 支持的 saved_model 格式、在本地使用 Docker 运行 TF Serving、通过 Jupyter Notebook 调用模型、以及创建 Flask 网关服务的完整流程。最终实现了通过图像 URL 获取模型预测结果的便捷服务。原创 2025-08-22 16:34:13 · 41 阅读 · 0 评论 -
25、无服务器深度学习与Kubernetes模型部署
本文介绍了如何使用TensorFlow Lite和AWS Lambda进行无服务器深度学习模型部署,以及通过Kubernetes和Kubeflow进行模型服务的流程。内容涵盖模型转换、Docker镜像构建、Lambda函数配置、API Gateway创建,以及在Kubernetes中使用TensorFlow Serving部署模型的方法。同时,还探讨了Kubeflow如何简化机器学习模型的部署过程,并对比了不同技术的应用场景和优势。原创 2025-08-21 11:31:47 · 60 阅读 · 0 评论 -
24、深度学习图像分类与模型部署
本文详细介绍了使用深度学习进行图像分类的完整流程,包括使用Xception模型对不同尺寸图像进行训练、模型评估与预测,以及将训练好的模型转换为TensorFlow Lite格式并在AWS Lambda上进行无服务器部署的方法。此外,还探讨了数据增强、模型优化和性能对比分析等内容,为构建高效的图像分类Web服务提供了实践指导。原创 2025-08-20 10:52:01 · 42 阅读 · 0 评论 -
23、深度学习模型训练与优化全流程指南
本文详细介绍了深度学习模型训练与优化的全流程,包括调整学习率、保存模型与检查点机制、添加更多网络层、正则化与丢弃法的应用以及数据增强策略。通过实验比较了不同参数设置对模型性能的影响,并提供了完整的代码示例和效果对比,旨在帮助读者提升模型准确率并防止过拟合。原创 2025-08-19 13:25:17 · 19 阅读 · 0 评论 -
22、卷积神经网络:从原理到实战应用
本文从卷积神经网络的基本原理入手,详细介绍了卷积层和密集层的作用,并以Xception模型为例,演示了如何进行图像分类任务的实战应用。通过迁移学习的方法,利用预训练模型提取特征,并针对具体任务训练新的密集层,实现高效的模型训练。同时,文章还探讨了学习率调整、过拟合问题及优化策略,并提供了完整的代码示例与优化建议,帮助读者更好地理解和应用卷积神经网络。原创 2025-08-18 12:53:58 · 38 阅读 · 0 评论 -
21、决策树、集成学习与神经网络在不同场景下的应用
本文详细介绍了决策树、集成学习(如随机森林和梯度提升)以及神经网络在不同场景下的应用。决策树和集成学习适用于结构化数据任务,例如贷款申请评分,而卷积神经网络(CNN)则在图像分类等非结构化数据任务中表现出色。文章还涵盖了XGBoost的实际代码示例、模型训练流程、参数调优以及使用预训练模型和迁移学习的方法。此外,还讨论了数据增强技术以提升模型泛化能力,并提供了不同模型适用场景的总结与对比。原创 2025-08-17 10:08:31 · 45 阅读 · 0 评论 -
20、随机森林与梯度提升:集成学习的强大力量
本文介绍了随机森林和梯度提升这两种集成学习方法的原理与实现。首先讲解了随机森林的基础知识、训练过程以及参数调优的方法,包括树的数量、最大深度和叶子节点大小对模型性能的影响。接着介绍了梯度提升的基本原理,并以XGBoost为例,详细说明了其安装、数据处理、训练、性能监控以及参数调优过程。最终通过对比不同参数下的模型表现,确定了适用于当前任务的最佳模型参数配置,为实际应用提供了指导。原创 2025-08-16 13:28:54 · 48 阅读 · 0 评论 -
19、决策树:原理、调优与应用
本文介绍了决策树分类器的原理、调优方法及其在信用风险评分中的应用。通过使用 Scikit-learn 库训练决策树模型,并利用 AUC 作为评估指标,分析了模型在训练集和验证集上的表现,讨论了如何通过限制树的深度和调整参数来避免过拟合问题。文章还详细解释了决策树的学习算法,包括特征选择、分割条件和停止标准,并展示了如何通过调优 `max_depth` 和 `min_samples_leaf` 参数提高模型性能。最终总结了整个调优流程,为实际应用提供了指导。原创 2025-08-15 12:35:47 · 29 阅读 · 0 评论 -
18、机器学习模型部署与决策树应用
本文详细介绍了机器学习模型的部署方法以及基于决策树和集成学习的信用风险评分项目。内容涵盖使用 AWS Elastic Beanstalk 进行模型部署、决策树和随机森林的基本原理、XGBoost 的梯度提升实现、模型调优方法(如网格搜索和随机搜索),并通过实际项目展示了数据清洗、特征工程、模型训练和评估的完整流程。原创 2025-08-14 11:40:45 · 28 阅读 · 0 评论 -
17、机器学习模型部署:从本地到云端
本文详细介绍了如何将机器学习模型从本地环境部署到云端,重点讲解了使用 Pipenv 管理 Python 依赖、使用 Docker 管理系统依赖,以及通过 AWS Elastic Beanstalk 实现服务部署的完整流程。文章还涵盖了部署优化策略,如镜像优化和弹性伸缩设置,并提供了常见问题的解决方案。通过这些方法,可以确保机器学习服务的可重复性和稳定性,适用于生产环境部署。原创 2025-08-13 16:09:37 · 37 阅读 · 0 评论 -
16、机器学习模型部署与服务化实践
本文详细介绍了如何将机器学习模型进行部署与服务化,包括模型预测函数的优化、使用Pickle保存和加载模型、创建Python脚本进行预测、将模型转换为Web服务的过程,以及使用Flask框架实现模型服务的具体步骤。同时,还介绍了服务测试、部署注意事项、模型更新与维护等内容,帮助读者全面了解机器学习模型在实际应用中的部署和服务化实践。原创 2025-08-12 12:05:26 · 64 阅读 · 0 评论 -
15、机器学习模型的参数调优与部署
本文详细介绍了机器学习模型的参数调优与部署流程。首先通过K折交叉验证评估模型性能并选择最佳参数C,接着使用Pickle保存训练好的模型,并利用Flask创建Web服务以提供预测接口。同时,介绍了如何使用Pipenv管理依赖、Docker打包服务以及将模型部署到AWS Elastic Beanstalk的全过程。通过这些步骤,可以将模型成功应用于生产环境,为业务决策提供支持。原创 2025-08-11 14:51:00 · 60 阅读 · 0 评论 -
14、分类评估指标:ROC曲线与AUC分数详解
本文详细解析了分类模型评估中的关键指标——ROC曲线与AUC分数。通过对比随机模型和理想模型,深入探讨了真正率(TPR)与假正率(FPR)的计算方法及其在模型评估中的应用。文章还介绍了如何使用Scikit-learn库绘制ROC曲线并计算AUC值,并提供了实际代码示例,帮助读者更好地理解和应用这些评估工具。原创 2025-08-10 13:52:28 · 33 阅读 · 0 评论 -
13、分类模型评估指标详解
本文详细介绍了机器学习中分类模型的常用评估指标,包括混淆矩阵、精确率、召回率、ROC曲线和AUC分数,并通过代码示例展示了如何计算和分析这些指标。文章还探讨了不同阈值对模型评估的影响以及在实际业务场景中的应用,为选择合适的模型和参数提供了实用指导。原创 2025-08-09 12:37:47 · 37 阅读 · 0 评论 -
12、机器学习分类模型评估指标详解
本文详细介绍了机器学习中分类模型的评估指标,包括准确率、混淆矩阵、精确率、召回率、ROC曲线和AUC等,并结合实际应用场景如客户流失预测和违约预测进行说明。同时,还讨论了数据预处理、逻辑回归模型、虚拟基线模型以及模型调参和交叉验证的方法,帮助读者全面理解分类模型的评估与优化策略。原创 2025-08-08 12:07:36 · 34 阅读 · 0 评论 -
11、机器学习分类:逻辑回归详解
本文详细介绍了机器学习分类中的逻辑回归模型,包括模型准确率的计算、权重的解释、模型的使用方法以及实际应用案例。通过具体代码示例和预测流程,帮助读者深入理解逻辑回归的工作原理,并探讨了特征选择对模型性能的影响。此外,还提供了一个营销领域的潜在客户评分项目实践,展示了如何利用逻辑回归进行实际问题的解决。原创 2025-08-07 13:15:04 · 104 阅读 · 0 评论 -
10、机器学习分类:特征工程与逻辑回归
本文介绍了在机器学习中如何通过特征工程处理分类变量,并使用逻辑回归模型进行客户流失预测。详细说明了独热编码的实现方法、逻辑回归的工作原理以及模型性能评估的关键指标,如准确率、精确率、召回率和F1值。此外,还讨论了逻辑回归的实际应用场景和建模过程中的注意事项。原创 2025-08-06 12:37:10 · 104 阅读 · 0 评论 -
9、客户流失预测项目的数据分析与特征重要性评估
本博客围绕客户流失预测项目,详细介绍了数据准备、探索性数据分析以及特征重要性评估的过程。通过检查缺失值、目标变量分布、分类和数值变量的特征重要性分析,明确了影响客户流失的关键因素,并规划了后续特征工程、模型训练及优化的步骤。为构建精准的客户流失预测模型提供了理论基础和实践指导。原创 2025-08-05 13:48:45 · 41 阅读 · 0 评论 -
8、机器学习:回归与分类实战
本博客详细介绍了机器学习中的回归与分类任务,重点探讨了回归任务的关键步骤和一个完整的客户流失预测项目。内容涵盖了特征工程、数据预处理、模型训练与评估等核心知识点,并通过实际案例展示了如何使用逻辑回归模型预测电信客户的流失情况。适合对机器学习实战感兴趣的读者学习和参考。原创 2025-08-04 10:05:02 · 36 阅读 · 0 评论 -
7、汽车价格预测:机器学习回归实践
本文详细介绍了使用机器学习回归方法进行汽车价格预测的实践过程。重点包括对分类变量的处理(如独热编码)、特征工程的构建(如车龄、车门数量等)、以及因添加过多特征导致的数值不稳定问题的解决方案——正则化(岭回归)。通过不断优化模型,最终实现了较为准确的价格预测,并对新数据进行了实际预测验证。文章还提供了代码优化建议、正则化参数影响分析以及模型评估指标的扩展,为进一步提升模型性能打下了基础。原创 2025-08-03 10:28:00 · 31 阅读 · 0 评论 -
6、回归机器学习:从理论到实践
本文介绍了回归机器学习的基础理论和实践应用,重点讲解了如何使用线性回归模型预测汽车价格。通过正规方程方法训练模型,结合缺失值处理、特征选择和特征工程等步骤,逐步优化模型性能。同时,文中展示了代码实现、模型评估指标RMSE的计算,以及如何通过流程图梳理整个预测过程。原创 2025-08-02 16:25:31 · 29 阅读 · 0 评论 -
5、汽车价格预测:从数据探索到线性回归建模
本博客围绕汽车价格预测项目展开,详细介绍了从数据探索、验证框架建立到线性回归模型训练与预测的全过程。通过对关键特征的分析,如`market_category`、`vehicle_size`等,结合数据集划分与对数变换,构建了线性回归模型进行预测。此外,博客还提供了模型优化思路,包括缺失值处理、特征工程改进以及更复杂模型的尝试,以提升预测性能。原创 2025-08-01 16:38:07 · 62 阅读 · 0 评论 -
4、机器学习回归实战:汽车价格预测
本文详细介绍了使用机器学习技术进行汽车价格预测的实战项目。从数据集下载、探索性数据分析、特征工程、线性回归模型实现,到模型评估与优化,完整展示了如何构建一个回归预测模型。通过本项目,读者可以了解机器学习在实际问题中的应用流程,并学习到Python相关库的使用方法。原创 2025-07-31 15:50:31 · 56 阅读 · 0 评论 -
3、机器学习入门:原理、流程与模型验证
本文详细介绍了机器学习的基本原理、监督式学习的类型以及其应用场景,同时解析了机器学习的整体流程和关键步骤。通过CRISP-DM框架,阐述了从数据准备到模型部署的迭代过程,并重点讲解了模型验证的重要性及方法。适合初学者全面了解机器学习的核心概念与实践技巧。原创 2025-07-30 09:15:02 · 52 阅读 · 0 评论 -
2、机器学习入门:原理、应用与实践
本博客为机器学习入门指南,涵盖机器学习的基本原理、与传统软件工程的区别以及多个实战项目,如汽车价格预测和电信客户流失检测。通过系统化的学习路径和代码示例,帮助读者从零开始掌握机器学习的核心概念与实际应用。原创 2025-07-29 13:34:57 · 29 阅读 · 0 评论 -
1、机器学习实践指南:从项目实战到模型部署
本博客是一份全面的机器学习实践指南,从基础概念到项目实战,再到模型的部署和管理,涵盖了回归、分类、决策树、集成学习、神经网络与深度学习等多种算法和技术。通过多个实际项目,如汽车价格预测、客户流失预测、信用风险评分以及时尚分类等,深入讲解了机器学习的核心流程、模型评估指标及部署方法,同时探讨了未来发展方向和持续学习建议,旨在帮助读者系统掌握机器学习的知识和技能。原创 2025-07-28 10:52:12 · 36 阅读 · 0 评论
分享