Spark ML
Last_xuan1
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pyspark mllib ALS 实践
数据集 https://tianchi.aliyun.com/dataset/dataDetail?dataId=56 基于 ALS 的 LFM 算法进行候选集召回 # 从用户行为日志数据集behavior_log 7亿 条数据中选取 100万 条 import pandas as pd import warnings warnings.filterwarnings("ignore") pat...原创 2020-02-04 14:44:32 · 704 阅读 · 0 评论 -
Spark Preprocessing&FE practice
最近因为要做推荐系统 ,为了熟悉 pyspark 的操作,并且熟悉一下处理日志数据 , 故尝试处理此数据集 数据集介绍 Ali_Display_Ad_Click是阿里巴巴提供的一个淘宝展示广告点击率预估数据集。 下载地址 https://tianchi.aliyun.com/dataset/dataDetail?dataId=56 , 数据名称 说明 属性...原创 2020-02-04 14:38:28 · 444 阅读 · 0 评论
分享