
spark
乘物游心0823
这个作者很懒,什么都没留下…
展开
-
关系型数据库引擎和分布式计算引擎中join实现对比
关系型数据引擎 分布式计算引擎(Spark) Nested-loop join Simple Nested loop join 两层for循环,外表一般为小表,内表为大表,效率低,一般不使用 无 Index Nested loop joi...原创 2020-03-21 07:44:05 · 452 阅读 · 0 评论 -
Spark
1.启动Spark shell 的命令 spark/bin/spark-shell --master local[2] 退出spark shell :q 启动后可以通过localhost:4040来查看spark的执行情况2.启动spark之前需要启动hdfs,命令 hadoop/sbin/start-hdfs.sh3.提交jar包,执行计算/usr/local/spark/...原创 2018-03-11 21:25:15 · 637 阅读 · 0 评论