HBaseCon Asia 2019 Track 2 概要回顾

本次回顾总结了HBaseCon Asia 2019大会中Track2的内容,涵盖大数据NoSQL系统、时序数据库、云数据库上的Phoenix改进实践、HBase的二级索引组件Pharos等多个主题。分享了来自阿里巴巴、小米等企业的实践经验和技术成果。

HBaseCon 没来参加怎么办?

三个Track没法同时听,分身乏术怎么办?

没关系~!“小米云技术”将用三期时间带你回顾

全部精华~!

Track 2:Ecology and Solution

在这个 Track,大家主要基于 HBase 根据实际需求构建系统。从横向来看,HBase 除了本身可用于 OLTP 之外,还能与 Spark、Solor 以及 Kafka 等系统集成起来提供 OLAP 的方案,阿里巴巴的云数据库团队提供了这样的例子,来自宝岛台湾的成功大学使用统一的协议用于不同存储系统之间的传输也是一个有意思的实践。从纵向来看,基于 HBase 构建时序、空间以及图数据库都是可行的,小米、阿里以及 Nebula 等公司介绍了这些方面的实践,这也显示了HBase 作为存储系统的通用性以及高性能。另外,大家对 HBase 查询优化的需求也是多方面的,既有阿里巴巴的基于 Phoenix 的查询优化,也有光大银基于协处理器实现了一个轻量级的二级索引系统。那么接下来小编将依次介绍Track2中的7个部分:

1、Big Data NoSQL System:Apsara DB Hbase and Spark

PPT下载链接:http://t.cn/AilB4m6R

来自阿里巴巴的 Wei Li 介绍了基于阿里巴巴云 HBase 构建的融合了计算、存储和检索以及在线和离线的的大数据中台解决方案,同时结合云上的弹性伸缩能力,节省成本。这是ApsaraDB HBase X-Pack 的架构图。

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

针对扫描大表,造成在线的 HBase 服务不稳定的问题,他们做了一个工作是把在线存储和离线分析使用的数据分离开来,通过一键归档把离线的数据转成列存的格式,带来性能十倍以上的提升,同时也不会影响 HBase 在线服务的稳定性,列存的方式是把源数据通过WAL同步到Spark 集群,存储成列的方式。数据归档完成之后,处理完的数据还需要写回到 HBase,这些数据的具体细节没有说明,可能跟业务有关,猜测是一些经过处理之后的聚合类数据等。他们没有通过传统的使用 HBase API 的方式,而是直接加载 HFile.最后一点是成本,使用云端数据库能带来两个方面的成本节省。一个是计算资源,一个是存储。计算资源是因为不同的业务有不同的波峰和波谷;存储是因为可以利用云上的廉价存储。最后他根据具体的几个 case 详细讲述了这套方案的案例。

2、OpenTSDB at Xiaomi

PPT下载链接:http://t.cn/AilBbhjp

来自小米的 Junhong Xu 首先介绍了时序数据和 OPenTSDB,然后详细介绍了 OpenTSDB 内部的实现以及底层的存储模型,最后是他们在实践中一些比较重要的配置项以及注意的问题。第二部分详细介绍了 OpenTSDB 迁移到 Kubernetes 的实践,包括需求、整个的流程和结构,每个组件的作用和配置,他们还在此基础上把它服务化,提供一个管理系统供用户申请、使用和管理。

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

相比之前的物理机搭建流程,新流程的效率从几个小时缩减到几分钟。最后是一些内部使用OpenTSDB 的案例。


3、Phoenix Improvements and Practices on Cloud HBase at Alibaba

PPT下载链接:http://t.cn/AilBbxCh

来自阿里巴巴的 Yun Zhang 介绍在阿里,他们是把 Phoenix 当做数据库来做的,既提供了直接访问下层的 HBase 能力,也提供了基于Solr构建二级索引快速访问HBase和搜索的能力,类似于传统数据库或者一些 New SQL 操作型分析和即时查询,响应时间是毫秒到秒级。

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

Phoenix 在数据库主要面向 TB、PB 级的数据体量,查询延时在毫秒和秒级的即时响应场景,另外过滤后的数据量不能太大,查询模式不能太多,便于 Phoenix 建立二级索引。另外,由于稳定性、维护性的问题,他们把 Phoenix 的重客户端模式演变成了轻客户端模式。最后他结合实际案例给出了一些最佳实践。


4、Pharos as a Pluggable Secondary Index Component

PPT下载链接:http://t.cn/Ailriayg

来自光大银行的 Lei Wang,主要内容是他们自己设计了一个 HBase 的二级索引系统,这个系统的主要作用是提高查询的效率。他们的设计目标是希望降低侵入性同时保证架构的简洁。由于需要排序等全局性的功能,所以客户端除了提供一个自定义的Condition查询条件外还需要提供额外的全局协调者的功能。

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==


他们这个设计有趣的地方是通过 rowkey 的设计和影子 Column Family 使索引文件与数据文件处于同一个 region 内,为了防止 Region Split 造成索引与数据文件不一致的问题,他们使用Index Builder 来基于数据重新生成索引。接下来他分别介绍了排序、分页和缓存的实现。最后展望了一些未来的规划,基于谷歌的 Percolator 提供事务的一致性、Bitmap 索引以及 CBO优化、与 Presto 集成等。


5、Bridging the Gap between Big Data System Software Stack and Applications:The Case of Distributed Storage Service for Semiconductor Wafer Fabrication Foundries

PPT下载链接:http://t.cn/AilriTRG

来自台湾成功大学的 Hung-chang Hsiao 带来的有关 HBase 应用于半导体晶圆制造行业的例子。

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

他们提供了一种融合多种不同存储系统的方案,解决了小文件问题,以及设计一个统一的协议使不同的存储系统之间和兼容以及透明传输,此外他们还设计和实现了一个负载均衡系统,并发表在 IEEE 上。


6、Nebula: A graph DB based on HBase

PPT下载链接:http://t.cn/Ailrirld

接下来是陈恒带来的使用 HBase 实现图数据库Nebula的介绍。

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

他首先介绍了图数据库是当前很流行的一个数据库,主要用于社交网络和知识图谱等。接下来他介绍了图数据库面临的一些挑战,包括传统的数据库读写带来的读写放大、在线海量数据查询等。然后 他介绍了 Nebula 的一些特点,包括存储于计算分离、类 SQL 查询(但不支持嵌套查询)以及与 MySQL 类似的存储引擎插件等。


7、Spatio-temporal Data Management based on HBase Ganos and its Spark Extension

PPT下载链接:http://t.cn/Ailr6Zh2

最后是阿里巴巴的技术专家 Fei Xiao。首先他介绍了时空数据的背景知识。

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

目前阿里内部主要有两条线来做时空数据库,一种是关系型数据库的模式,比如 PolarDB 或者PG,另一种是非关系型数据库。前者功能完备,但支持的数据量以及并发度不高,后者可扩展性较好,但功能没那么完善。接下来他介绍了基于 HBase 实现的时空数据库,并详细介绍了时空索引的原理。时空数据专业性较强,数据量较大,需要一些编码和解码以提高效率,同时也需要一些领域相关的知识。

本文首发于公众号“小米云技术”,转载请注明出处,原文链接: HBaseCon Asia 2019 Track 2 概要回顾


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31559359/viewspace-2651555/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/31559359/viewspace-2651555/

内容概要:本文详细介绍了一种基于Simulink的表贴式永磁同步电机(SPMSM)有限控制集模型预测电流控制(FCS-MPCC)仿真系统。通过构建PMSM数学模型、坐标变换、MPC控制器、SVPWM调制等模块,实现了对电机定子电流的高精度跟踪控制,具备快速动态响应和低稳态误差的特点。文中提供了完整的仿真建模步骤、关键参数设置、核心MATLAB函数代码及仿真结果分析,涵盖转速、电流、转矩和三相电流波形,验证了MPC控制策略在动态性能、稳态精度和抗负载扰动方面的优越性,并提出了参数自整定、加权代价函数、模型预测转矩控制和弱磁扩速等优化方向。; 适合人群:自动化、电气工程及其相关专业本科生、研究生,以及从事电机控制算法研究与仿真的工程技术人员;具备一定的电机原理、自动控制理论和Simulink仿真基础者更佳; 使用场景及目标:①用于永磁同步电机模型预测控制的教学演示、课程设计或毕业设计项目;②作为电机先进控制算法(如MPC、MPTC)的仿真验证平台;③支撑科研中对控制性能优化(如动态响应、抗干扰能力)的研究需求; 阅读建议:建议读者结合Simulink环境动手搭建模型,深入理解各模块间的信号流向与控制逻辑,重点掌握预测模型构建、代价函数设计与开关状态选择机制,并可通过修改电机参数或控制策略进行拓展实验,以增强实践与创新能力。
根据原作 https://pan.quark.cn/s/23d6270309e5 的源码改编 湖北省黄石市2021年中考数学试卷所包含的知识点广泛涉及了中学数学的基础领域,涵盖了实数、科学记数法、分式方程、几何体的三视图、立体几何、概率统计以及代数方程等多个方面。 接下来将对每道试题所关联的知识点进行深入剖析:1. 实数与倒数的定义:该题目旨在检验学生对倒数概念的掌握程度,即一个数a的倒数表达为1/a,因此-7的倒数可表示为-1/7。 2. 科学记数法的运用:科学记数法是一种表示极大或极小数字的方法,其形式为a×10^n,其中1≤|a|<10,n为整数。 此题要求学生运用科学记数法表示一个天文单位的距离,将1.4960亿千米转换为1.4960×10^8千米。 3. 分式方程的求解方法:考察学生解决包含分母的方程的能力,题目要求找出满足方程3/(2x-1)=1的x值,需通过消除分母的方式转化为整式方程进行解答。 4. 三视图的辨认:该题目测试学生对于几何体三视图(主视图、左视图、俯视图)的认识,需要识别出具有两个相同视图而另一个不同的几何体。 5. 立体几何与表面积的计算:题目要求学生计算由直角三角形旋转形成的圆锥的表面积,要求学生对圆锥的底面积和侧面积公式有所了解并加以运用。 6. 统计学的基础概念:题目涉及众数、平均数、极差和中位数的定义,要求学生根据提供的数据信息选择恰当的统计量。 7. 方程的整数解求解:考察学生在实际问题中进行数学建模的能力,通过建立方程来计算在特定条件下帐篷的搭建方案数量。 8. 三角学的实际应用:题目通过在直角三角形中运用三角函数来求解特定线段的长度。 利用正弦定理求解AD的长度是解答该问题的关键。 9. 几何变换的应用:题目要求学生运用三角板的旋转来求解特定点的...
Python基于改进粒子群IPSO与LSTM的短期电力负荷预测研究内容概要:本文围绕“Python基于改进粒子群IPSO与LSTM的短期电力负荷预测研究”展开,提出了一种结合改进粒子群优化算法(IPSO)与长短期记忆网络(LSTM)的混合预测模型。通过IPSO算法优化LSTM网络的关键参数(如学习率、隐层节点数等),有效提升了模型在短期电力负荷预测中的精度与收敛速度。文中详细阐述了IPSO算法的改进策略(如引入自适应惯性权重、变异机制等),增强了全局搜索能力与避免早熟收敛,并利用实际电力负荷数据进行实验验证,结果表明该IPSO-LSTM模型相较于传统LSTM、PSO-LSTM等方法在预测准确性(如MAE、RMSE指标)方面表现更优。研究为电力系统调度、能源管理提供了高精度的负荷预测技术支持。; 适合人群:具备一定Python编程基础、熟悉基本机器学习算法的高校研究生、科研人员及电力系统相关领域的技术人员,尤其适合从事负荷预测、智能优化算法应用研究的专业人士。; 使用场景及目标:①应用于短期电力负荷预测,提升电网调度的精确性与稳定性;②为优化算法(如粒子群算法)与深度学习模型(如LSTM)的融合应用提供实践案例;③可用于学术研究、毕业论文复现或电力企业智能化改造的技术参考。; 阅读建议:建议读者结合文中提到的IPSO与LSTM原理进行理论学习,重点关注参数优化机制的设计思路,并动手复现实验部分,通过对比不同模型的预测结果加深理解。同时可拓展尝试将该方法应用于其他时序预测场景。
先看效果: https://pan.quark.cn/s/a4b39357ea24 在易语言编程环境中,"获取树型框中当前选中项的完整路径"是一项基础且频繁使用的操作,其主要目的是检索用户在树型框(Tree View)组件中所选中节点的完整路径信息。 这一功能在设计用户界面时,特别是在处理文件系统或层级结构数据展示的情境下,显得尤为关键。 接下来将深入阐述这一技术要点。 易语言是一种面向对象且组件化的中文编程工具,其设计初衷是为了简化编程过程,使编程对普通用户更加友好。 在易语言中,内置了多样化的控件和函数库,旨在辅助开发者构建用户界面以及处理各类逻辑任务。 树型框(Tree View)控件是易语言提供的一种图形用户界面元素,能够有效展示具有层级关系的数据,常用于文件浏览器、目录结构可视化或自定义数据分类等应用场合。 每个节点均可能包含子节点,用户可以通过点击操作来展开或收起其子节点。 为了完成“获取树型框当前选中项的完整路径”的任务,需要运用以下核心函数:1. `树型框.获取选中节点`:该函数返回当前在树型框中被选定的节点。 若未选择任何节点,函数将返回一个空值。 2. `树型框.节点路径`:此函数用于获取指定节点的路径字符串。 路径通常是以特定分隔符(如`\`)连接的节点文本,体现了节点在树型框中的层级位置。 3. 循环和递归技术:鉴于树型框可能包含多层级的节点,必须遍历所有父节点以构建完整的路径。 这通常借助循环和递归技术实现,从当前选中的节点开始,向上追溯到根节点,每次调用`树型框.获取父节点`来获取上一级节点,直至到达根节点。 4. 文本操作处理:在获取到各个节点的路径信息后,可能还需要进行一些文本操作,例如添加起始或结束分隔符,或整合成一个完整的路径字符串。 下面提供一个简化...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值