机器学习模型嵌入 Web 应用全解析
1. 机器学习模型序列化
1.1 序列化概述
训练机器学习模型的计算成本较高,我们不希望每次关闭 Python 解释器或重新加载 Web 应用时都重新训练模型。Python 的内置 pickle 模块可以将 Python 对象结构序列化为紧凑的字节码,从而保存分类器的当前状态,以便在对新的未标记示例进行分类时重新加载,而无需重新从训练数据中学习。
1.2 序列化步骤
- 创建存储目录 :
import pickle
import os
dest = os.path.join('movieclassifier', 'pkl_objects')
if not os.path.exists(dest):
os.makedirs(dest)
- 序列化停用词和分类器 :
pickle.dump(stop,
open(os.path.join(dest, 'stopwords.pkl'), 'wb'),
protocol=4)
pickle.dump(clf,
open(os.path.join(dest, 'classifier.pkl'), 'wb'),
超级会员免费看
订阅专栏 解锁全文
1896

被折叠的 条评论
为什么被折叠?



