SparkSQL概述

1.1. SparkSQL介绍

SparkSQL,就是Spark生态体系中的构建在SparkCore基础之上的一个基于SQL的计算模块。SparkSQL的前身不叫SparkSQL,而是叫做Shark。最开始的时候底层代码优化、SQL的解析、执行引擎等等完全基于Hive,总是Shark的执行速度要比Hive高出一个数量级,但是Hive的发展制约了Shark。因此在15年中旬的时候,Shark的负责人将Shark项目结束掉,重新独立出来的一个项目,就是SparkSQL。Spark SQL不再依赖Hive,做了独立的发展,逐渐的形成两条相互独立的业务:SparkSQL和Hive-On-Spark。在SparkSQL发展过程中,同时也吸收了Shark有些特点:基于内存的列存储、动态字节码优化技术。

SparkSQL是用于结构化数据处理的Spark模块,与基本的Spark RDD API不同,SparkSQL提供的接口为Spark提供了有关数据结构和正在执行的计算的更多信息。在内部,SparkSQL使用这些额外的信息来执行额外的优化。有几种与SparkSQL交互的方法,包括SQL和Dataset API。计算结果时,将使用相同的执行引擎,这与用于表示计算的API/语言无关。这种统一意味着开发人员可以轻松的在不同的API之间来回切换,基于API的切换提供了表示给定转换的最自然的方式。

SparkSQL的发展历史:

  • 2014年:SparkSQL 1.0版本正式发布。
  • 2015年:SparkSQL 1.3版本正式发布,新增了DataFrame编程模型,也是目前使用到的编程模型。
  • 2016年:SparkSQL 1.6版本正式发布,新增了Dataset编程模型,提供了强类型支持,也就是在RDD的每行数据添加了类型约束。适用于Java、Scala。
  • 2016年:SparkSQL 2.0版本正式发布。
  • 2019年:SparkSQL 3.0版本正式发布,性能得到大幅提升。

1.2. SparkSQL的特点

image-20230207102357353

1.3. 总结

SparkSQL就是Spark生态体系中用于处理结构化数据的一个模块。

  • 结构化数据是什么?
  • 存储在关系型数据库中的数据,就是结构化数据.
  • 半结构化数据是什么?
  • 类似xml、json等的格式的数据被称之为半结构化数据.
  • 非结构化数据是什么?
  • 音频、视频、图片等为非结构化数据.

换句话说,SparkSQL处理的就是二维表数据

内容概要:本文详细介绍了HarmonyOS应用开发中Navigation菜单栏的设置方法及其重要性。文章首先阐述了Navigation组件的作用,指出它是构建流畅用户体验的关键,支持单栏、分栏和自适应三种显示模式。接着强调了菜单栏设置对用户体验的影响,通过具体案例展示了优化菜单栏能显著提升用户活跃度和应用留存率。随后,文章逐步讲解了菜单栏设置前的开发环境搭建、对Navigation组件的理解,以及菜单栏的具体设置步骤,包括基础设置、不同显示模式下的设置、标题栏与菜单栏的协同设置。最后,文章总结了菜单栏设置中的常见问题及解决方法,并提供了优化菜单栏设置的技巧,如合理规划菜单项数量、选择合适的图标和文本、提升菜单栏交互性。 适合人群:具备一定HarmonyOS开发基础的研发人员,尤其是希望提升用户体验的开发者。 使用场景及目标:①掌握HarmonyOS Navigation组件的基本功能和设置方法;②了解如何通过优化菜单栏设置提升用户体验;③解决菜单栏设置过程中常见的问题;④学习优化菜单栏设置的实用技巧,如合理规划菜单项数量、选择合适的图标和文本、提升菜单栏交互性。 其他说明:本文不仅提供了详细的菜单栏设置步骤和技术要点,还结合实际案例展示了菜单栏优化的效果,帮助开发者更好地理解和应用相关知识。此外,文中提到的开发工具和环境配置信息对初次接触HarmonyOS开发的人员尤其有用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据东哥(Aidon)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值