
spark从入门到实战
文章平均质量分 50
以实战为线索,逐步深入spark开发各个环节,掌握spark性能优化思路,打造完整的spark机器算法工作流,提升工程化编码能力和思维能力
优惠券已抵扣
余额抵扣
还需支付
¥29.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
尬聊码农
梦想是一个天真的词,实现梦想是个残酷的词。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pyspark入门教程
目录 一、windows下配置pyspark环境 1.1 jdk下载安装 1.2 Scala下载安装 1.3 spark下载安装 1.4 Hadoop下载安装 1.5 pyspark下载安装 1.6 anaconda下载安装 1.7 测试环境是否搭建成功 二、pysp...转载 2021-05-06 11:08:09 · 5748 阅读 · 0 评论 -
双向链表之java实现
public class DoubleLinkedList{ // 节点类Node private static class Node { Object value; Node prev = this; Node next = this; Node(Object v) { value = v; } public...原创 2019-07-10 20:46:01 · 124 阅读 · 0 评论 -
MySQL入门到实战(附上代码)
一、索引B+ Tree 原理MySQL 索引索引优化索引的优点索引的使用条件二、查询性能优化使用 Explain 进行分析优化数据访问重构查询方式三、存储引擎InnoDBMyISAM比较四、数据类型整型浮点数字符串时间和日期五、切分水平切分垂直切分Sharding 策略Sharding 存在的问题六、复制主从复制...原创 2019-07-12 22:34:36 · 1179 阅读 · 0 评论 -
redis入门教程学习(附上代码)
一、分布式锁数据库的唯一索引Redis 的 SETNX 指令Redis 的 RedLock 算法Zookeeper 的有序节点二、分布式事务本地消息表2PC三、CAP一致性可用性分区容忍性权衡四、BASE基本可用软状态最终一致性五、Paxos执行过程约束条件六、Raft单个 Candidate 的竞选多个 Candid...原创 2019-07-12 22:36:33 · 250 阅读 · 0 评论 -
redis使用教程大全(附代码)
一、缓存特征二、LRU三、缓存位置四、CDN五、缓存问题六、数据分布七、一致性哈希参考资料一、缓存特征命中率当某个请求能够通过访问缓存而得到响应时,称为缓存命中。缓存命中率越高,缓存的利用率也就越高。最大空间缓存通常位于内存中,内存的空间通常比磁盘空间小的多,因此缓存的最大空间不可能非常大。当缓存存放的数据量超过最大空间时,就需要淘汰部分数据来存放新到达的数据。...原创 2019-07-12 22:37:41 · 153 阅读 · 0 评论 -
图文解说spark算子
从大方向来说,Spark 算子大致可以分为以下两类:1)Transformation 变换/转换算子:这种变换并不触发提交作业,完成作业中间过程处理。 Transformation 操作是延迟计算的,也就是说从一个RDD 转换生成另一个 RDD 的转换操作不是马上执行,需要等到有 Action 操作的时候才会真正触发运算。2)Action 行动算子:这类算子会触发 SparkContext...原创 2020-05-13 16:05:32 · 273 阅读 · 0 评论