
Spark教程
文章平均质量分 55
心理学算法工程师
别人的矿在家里,我的在心里。
展开
-
简明机器学习系统概述
我们假设一个贴近实际的场景,我们现在需要建立一个为用户提供在线电影和电视节目的内容服务系统。业务成长迅速,用户量和收录的电影量都在增加,现有的业务结构如图所示:可以看到,现有的系统不断的收录用户数据,然后通过人工的方式选择和推荐电影实现对用户的推荐和批量营销。那么现在就有问题了,也许有人会质疑你,原有的方式不好吗?为什么非要机器学习?事实上,使用机器学习的理由有很多,不使用机器...原创 2018-12-19 13:36:33 · 909 阅读 · 0 评论 -
Scala版Spark简单商品统计程序教程--逐行精讲
题目是给一点点数据,统计总营业额,最受欢迎的商品啥的,很容易,适合练手:John,iPhone Cover,9.99John,Headphones,5.49Jack,iPhone Cover,9.99Jill,Samsung Galaxy Cover,8.95Bob,iPad Cover,5.49第一列人名,第二列商品名,第三列价格。每行代表一个订单记录,把他们复制到一个cs...原创 2018-12-13 19:06:36 · 1444 阅读 · 0 评论 -
Scala+Spark:PageRank算法逐行精讲
PageRank中的依赖关系PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名,是一种根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,以Google公司创办人拉里·佩奇(Larry Page)之姓来命名。Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。Google的创始人拉里·佩奇和谢尔盖·布林于...原创 2018-12-15 21:52:16 · 889 阅读 · 0 评论