大师兄师傅-优快云博客

原创 JavaRDD.mapPartitions和javaRdd.foreachPartition讲解

JavaRDD.mapPartitions和javaRdd.foreachPartition讲解

2024-08-21 18:21:02 461 1

原创 JavaRDD 提供了多少种方法来操作数据

Apache Spark 提供了丰富的 API 来操作数据，尤其是在JavaRDD类中。以下是JavaRDD提供的一些常用方法及其用途的总结。

2024-08-21 18:18:50 807

原创将全部包含2023的字段的txt文本全部替换成1.TXT的shell脚本

xargs 命令将找到的文件传递给grep -l 2023（包含2023字段的文件名，-l标识只输出文件名）-print0 和 -0参数确保文件名中的空格和特殊字符被正确处理，并通过管道传给下xargs命令。xargs - I {} mv {} ./1.txt将所有符合要求的文件都替换成1.txt。

2024-02-29 18:47:58 389

原创 shell不固定的多参数获取方法

bash script.sh 参数1 参数2 参数3。# 遍历所有的参数并打印它们。

2024-02-24 23:51:34 535

原创 hadoop中的distcp命令原理及应用

hadoop中的distcp命令原理及应用

2024-02-23 15:37:13 914

原创使用shell脚本实现目录下文件按照所需字符串进行排序输出

使用shell脚本实现目录下文件按照所需字符串进行排序输出

2024-02-22 18:59:14 490

原创 clickHouse物化视图的原理及应用

clickHouse物化视图的原理及应用

2024-02-21 11:32:01 624

原创 clickHouse高性能入库建议

clickHouse高效能入库建议

2024-02-21 11:11:43 875

在没有大模型的情况下，分析这些庞大的数据可能是一个巨大的挑战，因为数据可能涉及数千万甚至数亿的用户，包含通话记录、短信、上网行为、消费习惯等。首先，大模型在自然语言处理、计算机视觉等领域已经取得了显著的成果，未来随着技术的不断进步，大模型的性能将得到进一步提升，可以处理更加复杂、细致的任务。大模型的出现为人工智能技术的发展提供了新的思路和方法，未来随着大模型技术的不断发展和创新，将涌现出更多新的人工智能应用和技术。同时，大模型的训练和应用也需要大量的计算资源和专业知识，这也限制了大模型的普及和应用。

2024-02-20 18:26:32 1924

qq_23827347的博客

原创 JavaRDD.mapPartitions和javaRdd.foreachPartition讲解

原创 JavaRDD 提供了多少种方法来操作数据

原创 spark重试次数讲解

原创将全部包含2023的字段的txt文本全部替换成1.TXT的shell脚本

原创 shell不固定的多参数获取方法

原创 hadoop中的distcp命令原理及应用

原创使用shell脚本实现目录下文件按照所需字符串进行排序输出

原创代码实现龙型烟花秀

原创 clickHouse物化视图的原理及应用

原创 clickHouse高性能入库建议

原创什么是大模型，以及大模型的实用领域和前景

原创 clickHouse SQL调优

原创 clickHouse最佳实践参数调整

原创 clickhouse索引设计

原创 clickHouse分区设计

原创 clickHouse本地表设计

原创 ClickHouse之MergeTree引擎！

原创查看clickHouse中未压缩大小，已压缩大小，占有磁盘大小，总条数

空空如也

空空如也