
大数据
文章平均质量分 85
大数据技术
源图客
这个作者很懒,什么都没留下…
展开
-
Apache Flink 2.0介绍与部署(最新版本)
Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算。原创 2025-01-22 14:17:55 · 2180 阅读 · 0 评论 -
Apache Hudi 1.0.0源码编译
源码编译原创 2025-01-03 22:27:17 · 607 阅读 · 0 评论 -
Apache Doris 软件部署(2.1.7版本)
如果有返回值,则是支持avx2,如果没有返回值则需要下载no avx2。vim /etc/fstab 注释掉带swap分区。如果没有返回,则不支持avx2,后续下载包有影响。修改虚拟内存区域至少2000000。编辑fe.conf文件。编辑be.conf文件。原创 2025-01-01 19:26:24 · 1435 阅读 · 0 评论 -
Apache Doris介绍
Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型,以高效、简单、统一的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足加速等使用场景,用户可以在此之上构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。原创 2024-12-27 15:09:08 · 1154 阅读 · 0 评论 -
DataSphereStudio介绍
DataSphere Studio(简称 DSS)是微众银行自研的数据应用开发管理集成框架。基于插拔式的集成框架设计,及计算中间件,可轻松接入上层各种数据应用系统,让数据开发变得简洁又易用。在统一的 UI 下,DataSphere Studio 以工作流式的图形化拖拽开发体验,将满足从数据交换、脱敏清洗、分析挖掘、质量检测、可视化展现、定时调度到数据输出应用等,数据应用开发全流程场景需求。借助于。原创 2024-12-26 11:44:47 · 1279 阅读 · 0 评论 -
大数据专业技能及岗位解读
查询分析:Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Drill、FlinkSQL、Kudu、 Kylin、Druid、ClickHouse。操作系统:CentOS、Alma、Rocky、Ubuntu、openEuler、openKylin、TencentOS、OpenCloudOS。可视化:Tableau、Kibana、Superset、Grafana、Plotly、Metabase、FineBI、PowerBI。原创 2024-12-24 17:33:33 · 1104 阅读 · 0 评论 -
Apache SeaTunnel详解与部署(最新版本2.3.8)
SeaTunnel是一个非常易用、超高性能的分布式数据集成平台,支持实时海量数据同步。每天可稳定高效同步数百亿数据,已被近百家企业应用于生产。Apache SeaTunnel是中国开发者主导的项目,也是Apache基金会中第一个诞生自中国的数据集成平台项目。SeaTunnel原名Waterdrop,于2017年由乐视创建,并于同年在GitHub上开源2021年10月改名为SeaTunnel2021年12月9日SeaTunnel进入Apache孵化Apache SeaTunnel 毕业成为。原创 2024-11-07 22:38:20 · 7350 阅读 · 13 评论 -
Apache Celeborn详解与部署应用
Apache Celeborn 源于自研的 EMR Remote Shuffle Service,旨在解决中间数据遇到的及问题。原创 2024-10-26 12:06:36 · 1733 阅读 · 0 评论 -
Flink学习网-一个值得浏览的网站
今天在刷技术文章的时候,遇到了一个网站,网站有视频、博客,最重要的是有一些Flink相关的课件,虽然更新速度不是很快,但值得抽时间多去看看,以此记下地址,方便对Flink强化学习使用。原创 2024-10-25 23:20:44 · 170 阅读 · 0 评论 -
Apache Linkis介绍与部署
Apache Linkis 计算中间件项目,是由微众银行大数据平台团队在2019年7月进行开源,并于2021年8月正式捐献给全球顶级开源社区 Apache 软件基金会(ASF),成为 ASF 孵化项目。Apache 软件基金会(ASF)孵化器于2022年12月03日,通过了 Apache Linkis 计算中间件项目的孵化毕业投票。2023年01月18日,Apache 软件基金会官方宣布 Apache Linkis 顺利毕业,成为 Apache 顶级项目(TLP)。原创 2024-10-17 09:15:39 · 1474 阅读 · 0 评论 -
Apache Livy介绍与部署
Apache Livy 是一个为 Apache Spark 提供的强大而灵活的 RESTful 接口,旨在让开发者无论在何处,都能轻松地与 Spark 进行交互。这个开源项目支持执行代码片段或程序,并且可以在本地 Spark 环境或 Apache Hadoop YARN 集群中运行。应用场景总的来说,Apache Livy 是一个强大、开放且易于使用的工具,对于那些希望在 Spark 上构建更高效、更灵活的数据处理系统的开发者而言,它是一个理想的选择。原创 2024-10-16 11:14:01 · 1461 阅读 · 0 评论 -
DataX介绍与部署
DataX是由阿里巴巴研发并开源的一个异构数据源离线同步工具原创 2024-10-12 09:03:02 · 1058 阅读 · 0 评论 -
华为大数据平台-FusionInsight介绍
FusionInsight HD是华为开发的完全开放的大数据计算平台,基于开源社区软件进行功能增强,提供实时消息服务、实时事件处理,可运行在任意标准的X86服务器或华为TaiShan服务器上。原创 2024-08-01 17:01:41 · 1593 阅读 · 0 评论 -
讯飞大数据平台-Odeon(奏乐堂)介绍
Odeon架构原创 2024-08-01 16:36:32 · 173 阅读 · 0 评论