- 博客(1194)
- 资源 (291)
- 收藏
- 关注
原创 一文掌握 Velox orderby 算子的排序算法
通过前一步,我们已经算出哪些列支持规范化,以及每行规范化后的字符串占用多少字节(entrySize,注意,实际上列的数据规范化后的大小应该为 normalizedBufferSize,但是为了处理不支持规范化列的比较,所以每一行规范化后的字符串后面还会加上当前行在 rowContainer 里面的地址,所以 entrySize = normalizedBufferSize + 8)。如果直接把这个数据写到规范化的字符串里面,二进制 00010010 将被写到字符串的前面,那么比较的结果将是不对的。
2025-03-31 09:26:40
417
转载 2024 年数据库回顾:一年综述
本文原文来自:Databases in 2024: A Year in Review // Blog // Andy Pavlo - Carnegie Mellon University就像一颗子弹击中你的头顶,我回来了,要给你带来我关于数据库领域发生的事情的年度综述。是的,我曾经在OtterTune博客上写过这篇文章,但公司已经倒闭了(安息吧)。我现在在我的教授博客上发表这篇文章。过去的一年有很...
2025-01-03 08:34:38
170
原创 告别 Shuffle!深入探索 Spark 的 SPJ 技术
随着 Spark >= 3.3(在 3.4 中更加成熟)中引入的存储分区连接(Storage Partition Join,SPJ)优化技术,您可以在不触发 Shuffle 的情况下对分区的数据源 V2 表执行连接操作(当然,需要满足一些条件)。Shuffle 是昂贵的,尤其是在 Spark 中的连接操作中,主要原因包括:•Shuffle 需要跨网络传输数据,这是 CPU 密集型的。•在 S...
2024-12-26 18:02:22
1657
原创 在上千万行的 Java 代码迁移到 Kotlin 在 Meta 的实践
在当今数字化飞速发展的时代,软件编程语言的抉择对科技企业的开发效率与项目质量有着至关重要的影响。Meta 公司作为科技领域的巨头,做出了将大量Java代码迁移到Kotlin的重大决策。Meta之所以选择Kotlin,是因为Kotlin相对Java具有众多显著优势。Kotlin支持可空性和函数式编程,这使得代码在处理空值和逻辑处理上更加简洁高效;其代码更为简短,有助于提高开发效率;还能创建特定领域语...
2024-12-25 09:01:35
623
原创 Magnet: 基于推送的大规模数据处理Shuffle服务
本文翻译自:《Magnet: Push-based Shuffle Service for Large-scale Data Processing》摘要在过去的十年中,Apache Spark 已成为大规模数据处理的流行计算引擎。与其他基于 MapReduce 计算范式的计算引擎一样,随机Shuffle操作(即中间数据的全部对全部传输)在 Spark 中起着重要作用。在 LinkedIn,随着数据量...
2024-12-24 12:15:23
520
转载 Spark on Kubernetes 在多点DMALL的探索实践
摘要:多点在云原生建设中,全力推动Spark on k8s及大数据调度平台、日志采集、集群监控等组件的升级迭代,打造出了一套云中立,更具性价比的存算分离架构体系,平稳支撑了公司To B业务的开展。一、背景1.1 Hadoop 生态:短板凸显多点 DMALL 最初使用的是传统的 Hadoop 生态搭建大数据集群。使用 HDFS + Hive + Spark + Flink + Yarn 的经典组合,...
2024-11-08 10:49:57
143
转载 Elasticsearch 在滴滴的应用与实践
滴滴 Elasticsearch简介简介Elasticsearch 是一个基于 Lucene 构建的开源、分布式、RESTful 接口的全文搜索引擎,其每个字段均可被索引,且能够横向扩展至数以百计的服务器存储以及处理 TB 级的数据,其可以在极短的时间内存储、搜索和分析大量的数据。滴滴 ES 发展至今,承接了公司绝大部分端上文本检索、少部分日志场景和向量检索场景,包括地图 POI 检索、订单检索...
2024-09-13 18:15:20
383
转载 打造运营商实时分析平台——浩鲸科技 ByConity 应用实践
浩鲸科技 2003 年创建,为运营商提供高质量信息服务,在全球有多个研发中心。浩鲸科技正在进行业务全球化的布局,目前海外市场占比已接近 50%。国外运营商的用户规模小,用户业务量不高,运营商主机数量少。由于业务特点,其对独立小型部署需求较多。ByConity 给浩鲸科技提供了对应产品能力,帮助其解决了产品痛点,更好地满足了客户需求。本文将介绍浩鲸科技在电信运营商场景下使用 ByConity 进行实...
2024-08-02 19:14:50
156
转载 强烈建议企业数字化引入AI大模型!
如果你问:2024年,程序员必须掌握哪项技术?AI一定是榜首!从去年起,AI大模型已是程序员的必备工具——编程提效:编写更快,程序更稳定;代码更优:测试数、BUG对应减少;项目爆单:训练模型,接&做项目更快;输入prompt指令和搭建AI大模型开发框架,AI就能迅速批量完成工作,甚至比人工更出色。知名大厂都在布局AI市场,懂AI的程序员年薪甚至翻到80w-9...
2024-07-25 11:02:45
133
转载 2024企业级BI平台白皮书(附下载)
《企业级BI平台白皮书》是观远数据发布的业内首部聚焦规模型企业数字化转型,探寻BI平台企业级能力建设方法论的白皮书,也是观远数据基于多年来与超过400家先进企业携手数字化实践的经验沉淀与应对方案整合。白皮书从规模型企业数字化转型特有的挑战入手,针对企业丰富的数字化触点、规模化能力建设、智能决策、组织升级需求进行分析,梳理了规模化企业对于“企业级BI”能力的要求,建设性地提出了企业级BI“五力模型”...
2024-07-08 16:31:44
196
转载 强烈建议数据人学习AI大模型!
国内大模型“落地战”终于打响!一些大模型企业开始赚钱了最高单个项目金额近2亿元人民币除科大讯飞、阿里云、华为等巨头公司之外,很多中小企业也陆续进场各个机构与企业开始大刀阔斧招揽 AI 人才甚至开出80k*16的高薪,挖掘会使用 AI 的数据人才!作为数据人,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后...
2024-06-30 21:58:03
133
原创 深入了解 Presto 原生 C++ 查询引擎-Presto 2.0
在过去三年中,来自Meta、Ahana(现为IBM)、Intel和字节跳动的工程师团队联手打造了一款名为Velox的先进执行引擎,它的设计目标是可以在各种计算引擎之间灵活组合使用。在这个过程中,他们开发出了基于C++的Presto worker,这是一个全新的查询执行引擎,它基于Velox构建,此前被称为Project Prestissimo,现在则被命名为Presto 2.0。我们很高兴地宣布,...
2024-06-27 19:32:30
962
转载 Spark向量化计算在美团生产环境的实践
总第592篇 |2024年第012篇Apache Spark是一个优秀的计算引擎,广泛应用于数据工程、机器学习等领域。向量化执行技术在不升级硬件的情况下,既可获得资源节省,又能加速作业执行。Gluten+Velox解决方案为Spark换上了向量化执行引擎,本文将阐述美团在这一方向的实践和思考。1 什么是向量化计算1.1 并行数据处理:SIMD指令1.2 向量化执行框架:数据局部性与运行时开销1....
2024-06-20 21:11:17
236
转载 取代数据岗,中国又一新兴岗位在崛起!这才是数字化人未来5年最好的就业方向!...
随着GPT大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有60k*16的高薪,挖掘会使用 AI 的数据人才!作为数据人,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑数据人核心竞争力(不限年龄!不限岗...
2024-06-12 18:29:56
137
原创 Uber 提升 Presto 集群稳定性的 GC 调优方法
Presto at UberUber 利用开源的 Presto 查询各种数据源,无论是流式还是归档数据。Presto 的多功能性赋予我们做出基于数据的明智商业决策的能力。我们在两个地区运行了大约20个 Presto 集群,总共超过10,000个节点。我们有大约12,000个每周活跃用户,每天运行约500,000个查询,从 HDFS 读取约100 PB 的数据。现在,Presto 被用于查询各种数据...
2024-06-06 19:25:32
930
原创 重磅消息,Databricks 收购了 Apache Iceberg背后公司 Tabular
旧金山 — 2024年6月4日 — 专注于数据和人工智能的 Databricks 公司今天宣布,已经决定收购由 Ryan Blue、Daniel Weeks 和 Jason Reid 创办的数据管理公司 Tabular。这次收购汇集了 Apache Iceberg™ 和 Linux Foundation Delta Lake 的创始人,这两种开源 lakehouse 格式是目前领先的数据存储格式。...
2024-06-05 09:29:47
1091
转载 很严重,大家做好准备吧......
2024开年至今多家企业被曝裁员又降薪真搞得人心惶惶,坐立难安相反,作为席卷全球的新概念ESG真的是火爆了整个数据行业圈特别是政策要求各大企业强制披露ESG报告更是带来了巨大的市场和岗位需求ESG报告里最重要的一块就是数据披露和数字化建设这对于数据管理和数字化从业是一个重要的机会目前国央企、各大厂和实体企业都在大力布局甚至在行业圈内成为大佬们的热门话题目前行业裁员又降薪下大家冲一冲这个新兴领域01...
2024-06-04 10:26:00
156
转载 恭喜了!全体数据人彻底狂欢吧!这个好消息来得太及时!
【AI大模型人才培养计划】适用所有程序员2024年,AI在全球市场全面爆发。新的算法、模型和应用场景不断涌现,各个行业大模型应用激增,AI相关岗位需求增长超300%。无论是Google、百度、阿里等互联网巨头,还是中小型的科技公司都开出高于普通程序猿5倍薪资挖掘AI大模型人才。随着技术日新月异,各行各业对AI产品需求会不断攀升,大模型人才将更炙手可热。现在开始入局AI风口,很快就年薪100W!为帮...
2024-05-17 18:24:18
101
转载 最近这情况,奉劝大家还是多做一手准备吧
随着GPT大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有60k*16的高薪,挖掘会使用 AI 的数据人才!作为数据人,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑数据人核心竞争力(不限年龄!不限岗...
2024-05-07 12:09:41
95
转载 裁员了,很严重,大家做好准备吧!
2024刚开年,多家企业被曝裁员又降薪,真的是搞得人心惶惶,坐立难安。相反,作为席卷全球的新概念,ESG也真的是火爆了整个行业圈,尤其是的数据分析领域。特别是随着政策要求各大企业强制披露ESG报告,更是带来了巨大的市场和岗位需求,“ESG月薪炒到15万”的话题,更是不绝于耳。数据人作为践行ESG最直接的关联者,企业的ESG布局也是随着政策上涨,ESG数据分析岗几乎一夜之间成了最香的那一个。包括国央...
2024-04-24 12:36:05
180
转载 ByConity 替换 ClickHouse 构建 OLAP 数据平台,资源成本大幅降低
ByConity 是字节跳动开源的云原生数据仓库,在满足数仓用户对资源弹性扩缩容,读写分离,资源隔离,数据强一致性等多种需求的同时,提供优异的查询,写入性能。GitHub |https://github.com/ByConity/ByConity作者|程伟,MetaAPP 大数据研发工程师MetaApp 是国内领先的游戏开发与运营商,专注移动端信息高效分发,致力于构建面向全年龄段的虚拟世界。截至 ...
2024-04-23 08:30:11
126
转载 ByteHouse如何将OLAP性能提升百倍?
点击阅读原文,即可下载《云原生数据仓库ByteHouse性能白皮书(企业版)》在数据处理和分析的领域,提升查询效率始终是一项关键挑战。对于 OLAP 来说,性能的关键需求在于能支持实时分析,应对复杂查询,提供快速响应,并具备良好的可扩展性。这些方面,对于满足高效、准确的数据分析需求至关重要。火山引擎正式发布《云原生数据仓库ByteHouse性能白皮书》,白皮书通过使用 SSB 100G、TPC-H...
2024-04-19 18:30:03
124
转载 4月,一个新方向爆了,96k很稳...
国内AI赛道又爆了!继科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!人才市场上AI大模型工程师“一将难求”!甚至开出80k*16的高薪,挖掘AI大模型人才!如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?与其焦虑……不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!????知乎知学堂特邀你加入:行业前沿资源——AI大模型公开课已为本...
2024-04-14 18:54:50
97
转载 月薪已炒到15w?中国又一新兴领域在崛起!这才是数据人未来5年最好的就业方向!...
作为席卷全球的新概念!ESG这次真的火爆了整个互联网圈!“ESG拯救天坑专业”“靠ESG买下一套房”“ESG岗位月薪15万”的话题挠动了很多互联网人的心!让人忍不住发问,“这是什么神仙职业?”一、什么是ESG?如何快速“破局”入行!要弄懂这个“神仙”岗位,首先要明白什么是ESG。一句话介绍什么是ESG?ESG是一种关注企业环境(Environmental)、社会(Social)、治理(Govern...
2024-03-12 12:06:36
121
转载 年薪96w!一个薪资和前景都不错的方向,建议都冲一下!!
随着GPT大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有60k*16的高薪,挖掘会使用 AI 的数据人才!作为数据人,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑数据人核心竞争力(不限年龄!不限岗...
2024-03-06 10:18:39
116
转载 年薪96W!真心建议数据人冲一冲新兴领域,工资高前景好
随着ChatGPT大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有60k*16的高薪,挖掘会使用 AI 的数据人才!作为数据人,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑数据人核心竞争力(不限年龄...
2024-02-18 18:06:32
149
转载 第一批用AI做数据分析的人,已经碾压同事了!
Open AI 最新成果炸裂ChatGPT裂变成无数个GPTs“苹果”替代“诺基亚”的时代又要来临了!!2年内,传统 IT 岗位将失业被重塑!5年内,医疗/量化/互联网/办公等行业涌现新业态现在还不学习AI大模型训练技术或将很快面临“被淘汰”!作为普通程序员,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时...
2024-01-24 19:47:06
175
转载 微信基于 StarRocks 的湖仓一体实践
作者:StarRocks Active Contributor、微信 OLAP 内核研发工程师 冯吕小编导读:微信作为国内活跃用户最多的社交软件,其数据平台建设经历了从 Hadoop 到 ClickHouse 亚秒级实时数仓的阶段,但仍旧面临着数据体验割裂、存储冗余的问题。通过 StarRocks 的湖仓一体方案,以及和社区密切配合开发的实时增量物化视图,微信解决了“实时、极速”背后的“统一”诉求...
2024-01-17 08:02:04
263
转载 (此文价值极大)ChatGPT搞钱来了,数据人抓紧进!!
随着ChatGPT大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有60k*16的高薪,挖掘会使用 AI 的数据人才!作为数据人,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑数据人核心竞争力(不限年龄...
2024-01-07 08:01:20
158
转载 数据人请请入局AI,现在!立刻!马上!!
随着ChatGPT大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有60k*16的高薪,挖掘会使用 AI 的数据人才!作为数据人,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑数据人核心竞争力(不限年龄...
2023-12-19 08:01:36
185
转载 Presto 向量化引擎(Prestissimo/Velox)在 Meta 的一年总结
本文资料来自2023年12月06日举行的 PrestoCon 大会的题为《Prestissimo: A Year In, The Path to Veloxification》的 PPT,分享者- Amit Dutta, Meta Platforms, Inc。Prestissimo是一个雄心勃勃的项目,它使用 C++ 并利用开源执行引擎Velox重写了 Java 版本的Presto work...
2023-12-06 20:18:00
725
转载 快来参与!StarRocks Summit 2023现场四大亮点,错过等一年(内含福利)
还有一周,StarRocks Summit 2023 即将在上海举行。作为第一次线下峰会,我们难掩即将见面的激动与兴奋,为现场准备了多个互动亮点,希望能和你共度充实而快乐的一天。下面是本次峰会的四大亮点,提前分享给你。Evolution · 亮点一40+头部企业大咖的一线应用实践分享本届峰会将邀请来自40 余家来自华润、伊利、美的、腾讯、阿里、蔚来汽车、vivo、平安银行、京东物流等头部企业的...
2023-11-14 20:03:03
219
转载 yyds!懂行的数据人都开始用ChatGPT搞钱了!
国内AI赛道又爆了!继科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!人才市场上AI大模型工程师“一将难求”!甚至开出80k*16的高薪,挖掘AI大模型人才!如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?与其焦虑……不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!????知乎知学堂特邀你加入:行业前沿资源——AI大模型公开课已为本...
2023-11-04 20:02:31
226
转载 应用成本低出N倍的数据分析引擎esProc SPL
本篇可结合 《高效数据分析引擎》阅读高效数据分析引擎右侧扫码查看⇨目前网上有很多涉及 esProc SPL 的帖子,有方案介绍、测试报告、案例分享等,但这些材料大多只有某一方面,读者用户仍然难以整体理解。这里将原来各个点的内容串起来形成一个全貌,以便从整体上认识和理解 esProc SPL。我们介绍的 esProc SPL 是一个数据分析引擎,具备 4 个主要特点:低代码、高性能、轻量级、全功...
2023-10-16 08:03:10
539
转载 全网独一份!GPT+AI大模型资源,数据人请低调使用!
随着ChatGPT大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有60k*16的高薪,挖掘AI大模型人才!作为普通程序员,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑程序员核心竞争力(不限年龄!不限...
2023-10-13 08:00:48
198
转载 2023版最新最强大数据面试宝典
此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题,你的大数据能力将会大大提升,进入大厂指日可待!本文目录:一、Hadoop二、Hive三、Spark四、Kafka五、HBase六、Flink七、Clickhouse八、Doris九、数据仓库九、数据湖九、必备SQL题八、必备算法九、大数据算法设计题HadoopHadoop中常问的就三块,第一:分布式存储(HDFS);第二:分...
2023-10-10 08:01:38
396
转载 做 SQL 性能优化真是让人干瞪眼
很多大数据计算都是用 SQL 实现的,跑得慢时就要去优化 SQL,但常常碰到让人干瞪眼的情况。比如,存储过程中有三条大概形如这样的语句执行得很慢:select a,b,sum(x) from T group by a,b where …;select c,d,max(y) from T group by c,d where …;select a,c,avg(y),min(z) from T g...
2023-09-27 08:02:06
172
转载 40+指标银行BI选型指标体系!万字详述银行实现全面自助分析
《2023商业银行智能决策能力建设白皮书》是观远数据与亿欧智库联合正式发布,针对银行智能决策的建设背景、难点、路径与实践等进行全面阐述和分析的行业白皮书。《白皮书》详细阐述了商业银行“统计报表分析”、“局部自助分析”、“全面自助分析”、“智能决策”四大BI发展阶段,为银行智能决策发展情况提供印照路径。受限于数据应用程度影响,大多数银行仍处于局部自助分析阶段,《白皮书》从数据质量、组织文化、数字化工...
2023-09-06 12:30:34
362
转载 四川农信基于OceanBase升级核心系统,对客效率再上台阶
1951 年 12 月 25 日,四川省农村信用社联合社(以下简称“四川农信”)诞生于泸州黄舣乡。经几代四川农信人接续奋斗,七十余年栉风沐雨,四川农信已经成长为全省业务规模最大、服务网络最广、员工数量最多、历史底蕴最厚的银行业金融机构,为支持“三农”以及全省经济社会发展发挥着重要作用。截至 2022 年 12 月底,四川农信已经有 5022 个营业网点,近 4 万名从业人员,资产规模近 2 万亿元...
2023-06-29 17:37:29
427
转载 一个比SQLite还好用的数据库神器!
很多小微型应用程序也需要一些数据处理和计算能力,如果集成一个数据库就显得太沉重了,这种情况下 SQLite 是一个不错的选择,它架构简单,集成方便,可持久化存储数据,并提供 SQL 实现计算能力。但是,对于某些较复杂的场景,SQLite 仍有不足之处。SQLite面对复杂场景的不足数据源支持SQLite 像个数据库,可以对自有的库文件提供较好的支持,但应用程序有时还要处理其它形式的数据,比如文本文...
2023-06-19 08:03:28
718
HBase in Practise: 性能、监控和问题排查
2018-08-13
HBase Procedure V2介绍
2018-08-13
Scala Cheat Sheet
2018-07-04
Apache Hive Functions Cheat Sheet
2018-07-04
Apache Spark Cheat Sheet
2018-07-04
spark-summit-north-america-2018-06 全部 PPT -part1
2018-06-19
spark-summit-north-america-2018-06 全部 PPT -part2
2018-06-17
A Deep Dive into Stateful Stream Processing in Structured Streaming
2018-06-17
Implementing AutoML Techniques at Salesforce Scale
2018-06-17
Using AI to Deliver a Device as a Service
2018-06-17
Foundations of streaming SQL
2018-06-15
Deep Dive into Spark SQL with Advanced Performance Tuning
2018-06-11
Qcon北京2018-《区块链服务在华为公有云平台上的重要问题设计实现及解决方法》-张子怡.pdf
2018-05-16
QCon北京2018-强业务驱动的互联网+,技术管理的坑与路--廖雪梅.pdf
2018-05-16
QCon北京2018-《用正确分享来磨练专家实力——分享型专家升级记》-黄闻欣.pdf
2018-05-16
QCon北京2018-《Oracle区块链架构及其应用开发》-蒋春明.pdf
2018-05-16
Apache iceberg:Netflix 数据仓库的基石
2020-02-23
Apache Hadoop 3.x state of the union and upgrade guidance
2020-02-04
Apache Doris (Incubating) 原理与实践.pdf
2019-12-10
Spark SQL 在字节跳动的优化实践-郭俊.pdf
2019-12-03
Spark+AI Summit Europe 2019 Part 3
2019-11-03
Spark+AI Summit Europe 2019_iteblog.zip.002
2019-11-01
Spark+AI Summit Europe 2019_iteblog.zip.001
2019-11-01
The Delta Architecture Delta Lake + Apache Spark Structured Streaming.pdf
2019-10-28
Apache Spark 3.0, Koalas, Delta Lake 最新进展
2019-10-28
SPARK + AI SUMMIT 2019 全部 PPT
2019-09-21
From Stream Processor to a Unified Data Processing System
2019-04-20
Apache Spark 2.4 and beyond
2019-04-14
Flink社区专刊S2-重新定义计算
2019-04-11
从MPP数仓迁移至Spark:案例与最佳实践分享
2019-03-31
2018 Apache HBase 技术实战专刊
2019-01-07
Apache Spark Shuffle I/O 在 Facebook 的优化 [PDF]
2018-12-10
Apache Spark Shuffle I/O 在 Facebook 的优化
2018-12-10
不仅仅是流计算:Apache Flink实践
2018-11-29
Spark AI Summit Europe 2018 全部PPT - part1
2018-10-13
Easy, Scalable, Fault-tolerant stream processing with Structured Streaming-TD
2018-09-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人