海盒大数据平台 SDP7.1 产品版本发布详解
产品名称 海盒大数据平台
版本号 7.1
产品发布时间 2022-3-4
产品描述 SDP基础平台提供大数据的基础能力,包括分布式存储(HDFS、Hive等)、分布式计算(MapReduce、Spark、Flink等),集成了多个大数据基础组件(Yarn、 Zookeeper等)、数据规划(项目管理、数据源管理、库表管理、数据生命周期管理、元数据监测)、可视化部署运维、资源管控(存储/计算资源管理包括小文件管理、作业资源管理等,HDFS文件管理)、数据分析(离线/实时开发、数据查询、任务调度、数据挖掘、外部日志分析、知识图谱、Notebook建模分析、BI可视化)、数据安全(用户及权限管理、多租户管理、链接管理、平台日志、加密脱敏、访问审计)等。SDP多模数据管理功能支持业界主流的多种存储模型管理,包括宽表数据库管理(Hbase)、缓存数据库管理(Redis)、分析型数据库管理(Clickhouse)、时序数据库管理、消息队列管理(Kafka)、ES集群管理、大数据检索(Solr)、Mongo数据库管理、图数据库管理(Seagraph)、对象存储管理(SeaOSS)等在内的10种数据存储模型管理,满足不同业务场景,提高易用性并大幅降低综合成本。
功能模块
产品功能模块 模块描述
大数据集群管理 提供部署、运维、集成和管理多个大数据集群;可界面管理和操作各类大数据分布式存储引擎和计算引擎,满足不同规模和业务需求下的大数据处理和分析需求;同时通过集成管理容器云原生大数据集群,满足大数据上云和存算分离等业务需求。
3个节点起步,根据实际应用需要选配多个节点。
分布式存储引擎 提供对不同来源的多种数据进行整合,真正实现数据的管理,以数据资产的维护与管理作为核心功能,通过图形化界面提供一整套的数据管理(数据源、库、表)资源配置、成员维护等功能。基于多模型数据统一存储技术可实现PB级多模型数据统一存储。多种存储引擎支持多种数据模型包括表格存储服务,内存数据库,消息队列,搜索引擎等,轻松实现跨模型联合分析,一站式满足企业业务各种场景。
3个节点起步,根据实际应用需要选配多个节点。
分布式计算引擎 提供以湖仓一体为基础设施、流批一体成为标准架构。满足业务数据分析场景中的离线及实时数据开发及分析需求,解决企业湖仓系统中异构数据多,数据量大、数据应用复杂的难题。
3个节点起步,根据实际应用需要选配多个节点。