pickle序列化 statsmodels 2016.09.05回顾

最新推荐文章于 2025-08-20 09:44:28 发布

原创最新推荐文章于 2025-08-20 09:44:28 发布 · 341 阅读

0 ·

CC 4.0 BY-SA版权

日记同时被 2 个专栏收录

290 篇文章

订阅专栏

python

70 篇文章

订阅专栏

本文介绍了作者部署前海模型的过程，并探讨了序列化和反序列化的应用，包括使用pickle模块将类序列化到磁盘文件以及从磁盘加载序列化数据的方法。此外还提到了statsmodels库的应用场景。

1、昨天部署了新的前海模型，进行了一些调试沟通。

2、另外一方面研究了序列化和反序列化，其实json模块的json.dumps就是一种序列化成json这种通用交互格式，json.loads就是一种反序列化的方法，除了json通常用于网络传输，还有IO存入磁盘的序列化方法，也是tony给我的程序中涉及到的一种方式，研究了pickle模块，把一个类（或dict）序列化

import pickle

class Student(object):
    def __init__(self,name,age,score):
        self.name = name
        self.age = age
        self.score = score
     
    def print_score(self):
        print self.score

f = open('dump.pickle','wb')
pickle.dump(Student,f)
f.close()

pickle.dump方法可以把一个类序列化到一个磁盘文件，反序列化如下：

import pickle

class Student(object):
    def __init__(self,name,age,score):
        self.name = name
        self.age = age
        self.score = score
     
    def print_score(self):
        print self.score

f = open('dump.pickle','rb')
s = pickle.load(f)
s_instance = s('zhang',23,100)
s_instance.print_score()

注：这种反序列化需要知道该类的定义

3、回过头来，具体到tony给我的程序，首先他涉及到一个新的module，叫做statsmodels，这个是统计算法的一个包，实现了回归算法等等，但是他import了一个statsmodels.api，import statsmodels.api as sm，sm.load()加载了一个pickle（序列化的类？），但是为什么他这里不像我第二点那样需要对类进行定义？或者不是类？是生成器？我后来想探究这一点，但是发现第二步加载就出错了，最效率的办法就是等tony来了问清楚来龙去脉

4、利用baidu用某个关键词去搜索某个网站，关键词 site:www.XXXX.com

以上，就是下午做的工作