目录
一、 背景简述¶
本文简单介绍一个工业领域的机器学习建模到生产环境部署的案例。涉及机器学习开发项目的以下几个步骤
- 问题定义
- 数据采集
- EDA(探索性数据分析)
- 数据准备
- 建模
- 部署和监控
二、 环境准备
用到的主要工具库和框架
PyCaret:开源的低代码机器学习库,可用于自动化机器学习工作流
FastAPI:快速高性能的Web框架
plotly:数据可视化工具库
numpy:高效的数据计算工具库
pandas:DataFrame的高效处理工具库
uvicorn:高效的ASGI服务器
# 如未安装,可以通过以下命令行进行安装
pip install pycaret
pip install fastapi
pip install plotly
pip install uvicorn
如果 pycaret 下载缓慢,或者无法安装,可以尝试以下命令行
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pycaret
考虑到pycaret依赖的工具库可能和已经安装的工具库有版本的冲突,可以单独创建一个虚拟环境,安装所需的工具库pycaret等,再将虚拟环境作为核添加 至jupyter。可以通过以下步骤实现虚拟环境的创建和添加。
conda
工业级机器学习实战:从数据到部署的全流程

本文详细介绍了工业领域机器学习项目中的步骤,包括背景描述、环境准备(使用PyCaret、FastAPI等)、数据预处理(数据可视化和对数变换)、模型选择、训练及调优,最后展示了模型部署和API调用示例。
最低0.47元/天 解锁文章
1919

被折叠的 条评论
为什么被折叠?



