- 博客(8)
- 收藏
- 关注
原创 使用Spark DataFrame的randomSplit方法来将DataFrame分成多个批次
【代码】使用Spark DataFrame的randomSplit方法来将DataFrame分成多个批次。
2024-11-01 11:33:38
186
原创 Benchmarking
TPC-C:OLTP基准测试,评估系统在高并发、高交互的环境下处理事务的能力,其结果主要是以每分钟事务数(Transactions Per Minute,简称TPM)来衡量。"基准测试"(Benchmarking)是一种评估和比较系统性能的方法,它可以应用于各种不同的领域和系统,包括但不限于数据库、硬件、软件、网络和云服务等。TPC-H:数据仓库的基准测试,评估系统在处理大量数据和复杂查询的能力,其结果主要是以查询吞吐量(Queries Per Hour,简称Qph)来衡量。
2023-09-20 19:51:24
190
1
原创 java.io.FileNotFoundException: xxx/yarn-site.xml (Too many open files)
flink读写hbase时Too many open files
2022-07-01 10:06:31
399
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人