- 博客(16)
- 收藏
- 关注
原创 大数据管理平台 DataWings-查看运维大屏
运维大屏为您展示重点关注的任务运维指标及运行概况,帮助您快速了解大数据管理平台任务的整体概况,及时发现并处理异常任务,提升运维效率。
2024-12-19 08:15:00
656
原创 大数据管理平台 DataWings -告警管理
您可以在告警实例页面查看所有模块的监控告警信息,包括数据集成、数据质量、数据服务、数据地图、自定义监控规则等产生的告警信息。
2024-12-13 08:42:07
1064
原创 数据仓库调优表实践 -表结构设计
主要介绍表结构设计的最佳实践。在进行调优表实践之前,需要先了解下表结构设计相关的内容。因为进行数据库设计时,表设计上的一些关键项将严重影响后续整库的查询性能。表设计对数据存储也有影响:好的表设计能够减少I/O操作及最小化内存使用,进而提升查询性能。本小节介绍如何设计DWS表结构(包括选择表存储方式、压缩级别、分布方式、分布列以及使用分区表和局部聚簇等),从而实现表性能的优化。
2024-12-12 08:45:00
1281
原创 据库管理 -SQL查询优秀实践
执行去重会消耗大量的时间,因此,在一些实际应用场景中,如果通过业务逻辑已确认两个集合不存在重叠,可用union all替代union以便提升性能。查询中GROUP BY语句如果生成了groupagg+sort的plan性能会比较差,可以通过加大work_mem的方法生成hashagg的plan,因为不用排序而提高性能。根据数据库的SQL执行机制以及大量的实践总结发现:通过一定的规则调整SQL语句,在保证结果正确的基础上,能够提高SQL执行效率。−作业中多个SQL有同样的子查询,并且子查询数据量较大。
2024-12-12 08:15:00
432
原创 数据仓库-导入数据最佳实践
• 为了优化导入速度,建议拆分文件,使用多GDS进行并行导入。对于记录数超过千万条的表,建议在执行全量数据导入前,先导入部分数据,以进行数据倾斜检查和调整分布列,避免导入大量数据后发现数据倾斜,调整成本高。从OBS导入数据时,首先将您的文件上传到OBS存储桶中,我们建议您列出存储桶的内容,然后验证该存储桶是否包含所有正确的文件并且仅包含这些文件。从OBS上导入数据时,如下方法可以提升导入性能:将数据文件存储到OBS前,尽可能均匀地将文件切分成多个,文件的数量以DN的整数倍更适合。
2024-12-10 08:15:00
809
原创 数据仓库导入导出 -GDS实践指南
GDS支持并发导入导出,gds -t参数用于设置gds的工作线程池大小,控制并发场景下同时工作的工作线程数且不会加速单个sql任务。gds -t缺省值为8,上限值为200。在使用管道功能进行导入导出时,-t参数应不低于业务并发数。GDS外表参数delimiter是多字符时,建议TEXT格式下字符不要完全相同,例如不建议使用delimiter '---'。GDS多表并行导入同一个文件提升导入性能(仅支持text和csv文件)。主要介绍GDS最佳实践。
2024-12-10 08:00:00
798
原创 大数据管理平台 DataWings-查看 操作日志
您可以在操作日志模块查询和检索DataWings内进行的关键操作,同时也为您提供了日志总览的能力,查看不同模块的使用情况。
2024-12-09 07:30:00
636
原创 大数据管理平台 DataWings-引擎管理
集群信息同步或者注册完成后,您需要创建翼MR计算引擎,以便通过DataWings来执行该引擎类型的大数据计算任务。
2024-12-09 07:00:00
676
原创 大数据管理平台 DataWings- 监控规则管理
操作说明功能点描述检索可以按名称、业务来源、状态、等级查询自定义规则。下线下线当前规则,下线后当前规则将不再触发告警及运维动作。上线上线当前规则,上线后不可编辑。编辑重新编辑当前规则,仅下线的规则支持编辑。删除删除当前规则,仅下线的规则支持删除。规则配置说明字段说明业务来源当前自定义规则涉及的业务模块。对象类型当前自定义规则需要监控的对象类型,当前仅支持资源组。资源组名称资源组名称。监控指标当对象类型为资源组时,需要填写,可选择:cpu使用率、内存使用率、磁盘使用率。
2024-12-08 10:45:00
609
原创 大数据管理平台 DataWings-数据集成概述
数据集成提供简单易用的迁移能力和多种数据源到数据仓库的集成能力,降低了客户数据迁移和集成的复杂性,有效地提高数据迁移和集成的效率。
2024-12-08 08:15:00
1550
原创 大数据管理平台 DataWings -查看运维大屏
运维大屏为您展示重点关注的任务运维指标及运行概况,帮助您快速了解大数据管理平台任务的整体概况,及时发现并处理异常任务,提升运维效率。
2024-12-07 09:00:00
572
原创 大数据管理平台 DataWings-数据建模概述
数据建模支持制定并沉淀企业数据标准、数仓规划设计、数据指标定义、维度建模。通过维度建模的正向建模可以将设计产出的接入表、维度表、明细表、汇总表和应用表等物化到相应的数据源。通过维度建模的逆向建模可以将其他建模工具建的存量物理表反向建模到维度建模中,进行统一管理。该功能无需再次执行建模操作,即可快速将已有模型反向建模至维度建模中,可节省大量的时间成本。
2024-12-07 08:30:00
558
原创 大数据管理平台 DataWings - 数据源管理
数据源管理支持界面式管理数据源,包括新增、编辑、查询、删除等管理功能。数据源类型分为内置数据源和外部数据源,内置数据源需通过集群注册功能配置Hive组件信息,并成功创建对应引擎后,系统将自动创建内置数据源;外部数据源可通过数据源管理界面,直接新增外部数据源。
2024-12-06 11:40:11
616
原创 如何使用云GPU云主机构建Blender云端渲染服务
Blender 是一款永久开源免费的 3D 创作软件,支持整个 3D 创作流程:建模、雕刻、骨骼装配、动画、模拟、实时渲染、合成和运动跟踪,甚至可用作视频编辑及游戏创建。如果使用自己的镜像没有GRID图形驱动,将无法使用渲染OpenGL功能,请安装驱动,详情请参见。本文介绍如何使用云GPU云主机构建Blender云端渲染服务,完成简单的云渲染任务。实例环境如下表所示。
2024-12-06 11:36:00
1090
通信行业AI集群发展下数据中心间互联(DCI)趋势及德科立表现
2024-12-11
金融领域:保险公司三季度预增,快递市场持续增长
2024-12-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅