
Spark
山阴少年
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spark之获取GBT二分类函数的概率值
在Spark中,GBT(Gradient Boost Trees,提升树)函数用于使用机器学习中的提升树算法,目前仅支持二分类算法。笔者在实际工作中需要获得其预测的概率值,无奈该函数没有相应的方法。本文将分享在Spark中如何获取GBT二分类函数的概率值的思路。原创 2017-10-09 21:39:22 · 4202 阅读 · 3 评论 -
Spark之CASE...WHEN...THEN...的两种实现方式
在Spark中,dataframe是常用的数据格式,类似于数据库中的表。本文将介绍如何在dataframe中实现CASE…WHEN…THEN的两种方法。原创 2017-11-01 09:42:09 · 24512 阅读 · 1 评论 -
Spark之导出PMML文件(Python)
本文将介绍如何在Spark中导出PMML文件(Python语言)。原创 2017-12-04 12:56:47 · 4941 阅读 · 2 评论