跨平台机器学习实践小结（一）

最新推荐文章于 2023-07-14 17:37:18 发布

原创

最新推荐文章于 2023-07-14 17:37:18 发布 · 486 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#pmml #机器学习 #跨平台

本文探讨了在Node.js Web服务中调用sklearn模型预测的问题，分析了sklearn模型的存储方式，包括pickle和joblib，重点介绍了PMML作为跨平台标准的优势。通过JPMML库在Java中应用PMML，支持sklearn等框架。同时，文章指出了sklearn2pmml生成的PMML文件与Python图形库生成的dot文件在结构上的差异，但预测结果基本一致。

一、问题来源：

如何在node web服务下调用sklearn的模型结果来进行实时模型预测？

二、问题分析：

1、sklearn的模型结果有几种存储方式：

（1）pickle.dumps ，结果通过变量保存在内存中

附上pickle文档：https://docs.python.org/2/library/pickle.html

>>> import pickle
>>> s = pickle.dumps(clf)
>>> clf2 = pickle.loads(s)
>>> clf2.predict(X[0:1])
array([0])

（2）joblib.dump，持久化到二进制文件pkl中，可复用性更强

>>> from sklearn.externals import joblib
>>> joblib.dump(clf, 'filename.pkl')

预测时，在另一个python进程中可以执行：

>>> clf2 = joblib.load('filename.pkl')

（3）pmml文件，PMML一种使用xml描述模型的语言标准

最有用的参考文档是：http://dmg.org/pmml/v4-1/GeneralStructure.html ，对PMML文件的结构及标签含义都有较清楚的说明。

先说明一下生成方式，以sklearn的gbdtregression为例：


from sklearn2pmml import sklearn2

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

阿喵酱紫糖

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

从零开始构建机器学习平台——架构设计、模块拆解及实现方案

AI天才研究院

08-10

1792

概述在当今数据驱动的时代,机器学习已经成为众多行业和领域的核心技术。然而,构建一个完整、高效且可扩展的机器学习平台仍然是一项复杂的工程挑战。从数据收集和预处理,到模型训练、评估和部署,再到持续监控和优化,每个环节都需要精心设计和实现。本文旨在为读者提供一个全面的指南,详细介绍如何从零开始构建一个功能完备的机器学习平台。我们将深入探讨平台的整体架构设计,各个关键模块的功能和实现,以及在实际开发过程中可能遇到的挑战和解决方案。

gcp-ml:Google Cloud Platform机器学习样本

05-25

GCP-机器学习 课程此仓库是我的LinkedIn学习课程“ GCP ML Essentials”的伴侣-https: 主题领域以下所示的服务的Google Cloud Platform Analytics和机器学习示例。当前示例包括以下内容： GCP Colabs （Jupyter风格）笔记本用于BigQuery（连接并运行SQL查询）适用于BigQueryML（使用ML模型进行连接，构建，训练和预测）重要信息：使用每个笔记本中的链接在GCP Colabs环境中将其打开带GPU的TensorFlow的-速度测试对于生产工作负载，您可能需要付费并使用ColabPro（$ 10 / mo），以获得更快的GPU，更长的笔记本运行时间和更多的内存脚本和代码示例适用于SQL中的BigQueryML 视觉API 自然语言API 适用于AutoML视觉和自然语言适用于

参与评论您还未登录，请先登录后发表或查看评论

大数据机器学习模型跨平台上线

akenseren的博客

01-06

306

资料： 1.用PMML实现机器学习模型的跨平台上线 2.tensorflow机器学习模型的跨平台上线 3.在Java Web中使用Spark MLlib训练的模型 4.跨平台机器学习模型交互–PMML简述 5.PMML model export - RDD-based API 6.spark-ML基础 7.SparkML GBDT&RF算法使用示例 8.Spark ML离线...

项目实训（八）移动端感悟

Starybirds7的博客

08-24

1616

本次项目创新实训我作为移动端的开发成员参与，收获了很多。虽然一边实习一边做项目，时间比较紧张，但是还是完成了所需的功能，完成了一个比较满意的项目。这实际上是一个边做边学习的过程，在做项目的过程中我遇到了各种各样的问题，我把他们都整理在了博客里面，每次都要在网上查资料然后学习解决，在这个过程中我的技术得到了增长。我们做的是一个图片社区，没有美工人员，所以界面上的细节可能打磨的不是很完美，但是...

探索跨平台应用开发的最佳实践

历史上的今天

09-18

643

成本低、周期短，易于上手，不用重新设计，种种好处让跨平台开发风头无量，数以万计的开发者和开发工具及服务提供商们都在实践中找寻“最趁手”的跨平台开发解决方案。从各大主流移动平台一应俱全的 PhoneGap，用 C# 开发 iOS、Android Apps 的 Xamarin，到当前风头无量的 React Native，以及在国内已多有运用的 Weex 等。那么，对于开发者而言，如何做跨平台开发工具选...

python数据处理方法——pkl格式文件

m0_55196097的博客

07-14

4万+

在 Python 编程中，我们通常需要将数据保存到文件中以便在以后的执行中使用。pkl 文件是一种常见的文件格式，它可以保存 Python 对象的状态，并且可以在需要时将其恢复到内存中pkl 文件是以二进制格式保存的。pkl 文件提供了一种简单而有效的方法来序列化和反序列化 Python 对象，使其易于存储、传输和共享。1.1 什么是 pkl 文件？pkl文件是指使用Python的pickle模块生成的二进制文件，用于将Python对象序列化到磁盘上。

机器学习教材习题及答案1

08-08

总结，机器学习的学习不仅包括理论概念，还涉及到实际操作，如使用Python库、数据处理和实验实践。理解这些库的作用和数据处理流程，以及掌握如Jupyter Notebook这样的工具，对于深入学习和应用机器学习至关重要。...

Ytk-learning库：跨平台分布式机器学习算法实现

总结以上知识点，Ytk-learning是一个功能全面的分布式机器学习库，它不仅包含了丰富的机器学习算法，而且具有良好的跨平台运行能力和对主流分布式计算框架的支持。通过高效的通信机制，它能够在大规模分布式环境下...

跨平台机器学习迁移术：在不同平台上高效迁移PAI模型

随着计算技术的快速发展，跨平台机器学习迁移变得越来越重要，它允许模型在不同平台间进行有效迁移，扩展了机器学习应用的范围和深度。本文首先概述了跨平台机器学习迁移的含义及当前研究状况，接着深入探讨了机器...

基于机器学习的智慧党建平台.zip

热门推荐

lvfeiya的博客

11-28

5万+

以mnist.pkl为例方法一：然而我的还是会出现EOFError，无解，郁闷方法二： dataset=’mnist.pkl’ datasets = load_data(dataset) train_set_x, train_set_y = datasets[0] valid_set_x, valid_set_y = datasets[1] test_set_x, test_s

sklearn中集成学习（下）

小强强的博客

02-01

1万+

****************************************************************************** 这部分有些地方没有翻译，笔者自己不是能很好理解。希望大家多多帮助！ ****************************************************************************** 1

如何将模型转换为pmml文件，Python生成PMML模型文件

lquarius的博客

05-30

4113

开发工具: PyCharm 语言：Python 3.7 三方包 sklearn --机器学习 https://scikit-learn.org/stable/ sklearn2pmml --把机器学习模型翻译成PMML文件任务读取数据，训练模型，输出PMML文件示例代码： from sklearn import tree from sklearn.datasets ...

用 pickle 实现简易“跨”Python实现平台的调用

一个被IT搞的

04-06

446

有一次在用 Python 开发的时候遇到个问题：既需要调用 .Net Assembly，又需要调用只支持 CPython 的 module. 对于前一种场景，我们只能用 IronPython 作为引擎。对于后一种场景，我们只能用 CPython。当时找到一种简易的方法：遇到需要调用的模块不支持当前 Python 引擎时，让另一个 Python 引擎在独立的进程中执行目标方法，通过进

GBDT回归实战完全总结(二)

xiaoliuhexiaolu的博客

06-05

3693

第二部分：sklearn分类实例（一）、实例一：Gradient Boosting regressionDemonstrate Gradient Boosting on the Boston housing dataset.This example fits a Gradient Boosting model with least squares loss and 500 regression t...

查看python中的pkl文件的方式

时间虚掷的孤岛

12-21

4977

import cPickle as pickle f = open('path') data = pickle.load(f) print (data) #show file

Python中的.pkl文件

BockSong的博客

07-27

2万+

pkl文件是python里面保存文件的一种格式，如果直接打开会显示一堆序列化的东西。正确的操作方式是使用Pickle模块。Pickle模块将任意一个Python对象转换成一系统字节，这个操作过程叫做串行化对象。打开方式： import cPickle as pickle f = open('path') info = pickle.load(f) print info #show f...