Alluxio
文章平均质量分 69
DPnice
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
集群上独立运行Alluxio1.8使用HA HDFS为底层存储系统
软件版本:软件版本jdkjdk1.8.0_191zookeeperzookeeper-3.4.12hadoophadoop-2.8.5alluxioalluxio-1.8.0-hadoop-2.8配置JDK:解压并创建软链接:$ sudo ln -s /opt/Software/jdk1.8.0_191/ /jdk配置环境变量:$ v...原创 2018-11-30 17:56:41 · 1266 阅读 · 0 评论 -
在Alluxio1.8上运行Spark
软件版本:软件版本jdkjdk1.8.0_191zookeeperzookeeper-3.4.12hadoophadoop-2.8.5alluxioalluxio-1.8.0-hadoop-2.8sparkspark-2.3.2-bin-hadoop2.7spark版本不对应,不推荐使用安装配置spark:解压:$ tar -...原创 2018-12-03 18:20:22 · 442 阅读 · 0 评论 -
SparkSql读取pgxl数据缓存到Alluxio再计算
http://www.alluxio.com/blog/effective-spark-rdds-with-alluxioSpark的RDD本身数据就是存储到内存,但是如果数据量超大 spark cache 到内存 会导致性能显着下降。Alluxio允许将更大的数据集保存在内存中,从而实现更快的Spark应用程序。Alluxio还支持在内存中与多个Spark应用程序共享相同的数据集,这可以提高...原创 2018-12-28 18:21:19 · 442 阅读 · 0 评论 -
Spark+Alluxio性能调优十大技巧
Spark+Alluxio性能调优十大技巧由于统一访问对象存储(如S3)和HDFS数据的场景的出现和普及,Apache Spark结合Alluxio的大数据栈越来越受欢迎。此外,越来越流行的计算与存储分离的架构导致计算端查询延迟增大。因此,Alluxio常被用作贴近计算端的热数据存储以提高性能。为了能够获得最佳性能,用户需要像使用其他技术栈组合一样遵循最佳的实战经验。本文介绍了在Alluxio上...转载 2019-01-09 16:52:38 · 691 阅读 · 0 评论
分享