
Spark ML -> Kaggle
无知书童
这个作者很懒,什么都没留下…
展开
-
P0 Spark MLlib(机器学习库)
@[TOC])(P0)Spark MLlib(机器学习库)使用Spark框架将常见机器学习算法实现,以供使用,类似Python语言中机器学习库sk-learn。1. 提供API以供使用从Spark 2.0开始 官方推荐使用基于DataFrame API算法库a. 基于RDD实现算法库org.apache.spark.mllibhttp://spark.apache.org/docs/...原创 2019-09-12 10:53:07 · 138 阅读 · 0 评论 -
P1_1 推荐系统 (背景介绍)
P1_1 推荐系统推荐引擎:案例分析推荐方式个性化推荐推荐引擎:通过探寻不同物品(产品Item、Product)或者不同用户之间喜好的联系,用于预测用户喜好的物品。案例分析以亚马逊图书推荐为例:Spark机器学习-a. 推荐一: 1 Product经常一起购买的商品-b. 推荐二: 5 * 12 = 60 Product浏览此商品的顾客也同时浏览-c. 推荐三: 5 * 20 ...原创 2019-09-12 11:54:38 · 1859 阅读 · 0 评论 -
P1_2 推荐系统 (淘宝推荐系统)
P1_2 推荐系统淘宝推荐系统算法基础算法推荐算法效果评估淘宝推荐系统算法基础算法聚类算法,预测算法,分类算法等,主要用于产生基础知识库推荐算法content-based,collaborative-based,Association Rules基础算法预测算法logistic回归,通过以点击率为目标,以商品,卖家等因素作为指标,建立预测模型构建淘宝优质宝贝库分类算法朴素贝叶...原创 2019-09-12 12:58:51 · 660 阅读 · 0 评论 -
P1_3 推荐系统 (协同过滤算法)
P1_3 协同过滤算法协同过滤算法步骤协同过滤算法协同过滤推荐算法,是最经典、最常用的推荐算法。通过分析用户兴趣,在用户群中找到指定用户的相似用户,综合这些相似用户对某一信息的评价,形成系统关于该指定用户对此信息的喜好程度的预测。步骤1.收集用户偏好2.找到相似的用户或物品3.计算推荐...原创 2019-09-12 19:42:12 · 532 阅读 · 0 评论 -
P1_4 推荐系统 (Spark MLlib ALS算法)
P1_4 推荐系统Spark MLlib ALS算法解释参数:推荐Spark MLlib ALS算法由于用户对产品的评价分为两种,所以ALS算法训练数据的函数有两类:-a. 针对显式评价数据训练函数def train(ratings: RDD[Rating], rank: Int, iterations: Int)-b. 针对隐式评价数据训练函数def trainImplicit(ra...原创 2019-09-12 20:04:22 · 309 阅读 · 0 评论