- 博客(5)
- 收藏
- 关注
原创 阿里云ACA官方PPT考试重点
HBase是一个分布式的、面向列的开源NOSQL数据库,存储海量数据,单表可以有百亿行、百万列,并完成对海量数据随机与实时读写操作。图数据库是以点、边为基础存储单元,以高效存储、查询图数据为设计原理的数据管理系统,图数据库是一组点和边的集合,“点”表示实体,“边”表示实体间的关系,通过点、边和属性等方式来表示和存储数据。NOSQL泛指非关系型的数据库(Not nly SQL),有灵活的数据模型,可以避免Jin联接,易于扩展,数据类型更丰富,支持高并发的访问,支持海量数据分布式存储。
2023-09-22 09:57:34
176
原创 期末考试题库5
PAI平台MaxCompute在大数据处理与分析中的功能因MaxCompute强大的功能特性,数以万计的企业正基于MaxCompute进行数据计算与分析。MaxCompute在大数据处理与分析中的功能主要有以下三点:弹性能力与扩展性存储和计算独立扩展,支持企业将全部数据资产在一个平台上进行联动分析,消除数据孤岛;实时根据业务峰谷变化来分配资源。集成 AI 能力与机器学习平台PAI无缝集成,提供强大的机器学习处理能力;用户可使用熟悉的Spark-ML开展智能分析;使用Python机
2023-09-20 21:53:19
1455
1
原创 期末考试题库3
311.小明在一家IT教育公司做运营工作,经常听到同学聊到MaxCompute核心概念,但又不知其意,下列哪些选项( ABCDE )能帮助小明更好的了解MaxCompute。A:Project(项目)项目是MaxCompute的基本组织单元,类似于传统数据库的Database或Schema的概念,是进行多用户隔离和访问控制的主要边界B:Partition(分区)分区Partition是指一张表下,根据分区字段(一个或多个字段的组合)对数据存储进行划分C:View(视图)视图是在表之上建立的虚拟表,它的
2023-09-20 21:51:55
3223
1
原创 期末考试题库2
62.下面哪一个是属于Spark的分布式图处理框架?(A)A:GraphXB:DremelC:ImpalaD:DStream解析:Spark的GraphX支持图计算的库,支持丰富的图计算的算子,包括属性算子、结构算子、Join算子和邻居聚合等。 https://help.aliyun.com/document_detail/441938.html63.通过日志规则设置,可以对业务系统中对用户的哪些数据进行采集?(C)A:图片和评论B:音频信息和视频信息C:用户使用
2023-09-20 21:43:04
1999
1
原创 期末考试题库
45.案例:政务数据中台汇聚了自然人、法人组织、城市资产、城市感知、行为事件、地理空间、宏观经济、自然资源、公共服务、电子证照十大主题政务数据,开展模型治理和数据清洗加工,事前以标准事项库为最佳实践优化地方事项库,事中提供统一的标准数据服务,事后对办件库分析得出优化点反过来丰富标准事项库,形成事前事中事后的闭环。解析:Spark的MLlib提供了较丰富的机器学习库,包括分类、回归、协同过滤、聚合,同时提供了模型选择、自动调参和交叉验证等工具来提高生产力。关千这两种方式的说法中正确的是().。
2023-09-20 21:36:30
185
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人