
大数据
文章平均质量分 91
大数据相关
进朱者赤
阿里非典型程序员一枚:微信公众号同名,记录平平无奇程序员在大厂的打怪升级之路。
Java、大数据、数据结构算法
展开
-
Scala特色功能点
总的来说,Scala 就像是编程界的“瑞士军刀”,功能强大、灵活多变,让开发者们在编写代码时如鱼得水。虽然 Java 依然在企业应用中占据一席之地,但 Scala 的现代特性和优雅语法无疑让它在某些场合下更具吸引力。原创 2024-12-12 01:08:35 · 1126 阅读 · 0 评论 -
用 Java 的思路快速学习 Scala
Scala 中的函数定义与 Java 方法类似,但更为简洁。Scala 支持高阶函数和匿名函数。函数定义// Java// Scala匿名函数// Java// ScalaScala 是一种强大且灵活的编程语言,结合了面向对象和函数式编程的优点。通过掌握 Scala 的基本语法、高级特性、设计模式以及最佳实践,你可以在实际项目中充分发挥其优势。原创 2024-12-12 01:05:56 · 547 阅读 · 0 评论 -
Spark中的RDD和DataFrame
在Apache Spark中,RDD和DataFrame是处理大数据的两种主要数据结构。下面是一个总结表格,展示了它们的用法和相关API,帮助理解它们的主要功能和操作。特性/操作RDDDataFrame定义低级API,提供细粒度的数据操作能力。高级API,基于Spark SQL构建,提供类似关系数据库的操作。数据类型支持任何类型的Python、Java、Scala对象。优化的行列数据存储。需要定义schema。创建转换操作map()filter()select()filter()groupBy()原创 2024-12-09 15:23:14 · 670 阅读 · 0 评论 -
浅谈Scala语言
Scala语言虽然是一门较新的编程语言,但它在简化数据处理和分析任务方面显示出了显著的优势。通过本文的介绍,我们希望你能对Scala有一个全面的了解,从基础语法到实际应用,再到在Spark中的集成使用,以及面临的挑战和未来的发展方向。随着技术的不断进步和数据科学领域的快速发展,掌握如SLACA这样的工具将为数据科学家和工程师提供更多的机会,帮助他们在数据驱动的世界中取得成功。无论是在学术研究还是在商业应用中,Scala都有望成为一个重要的力量。原创 2024-12-08 22:07:59 · 683 阅读 · 0 评论 -
Java 转Scala的那些异同
在这个数据爆炸的时代,大数据应用如雨后春笋般涌现。作为一名 Java 开发者,你可能会发现 Scala 这个新世界充满了诱惑。Scala 结合了面向对象和函数式编程的优点,尤其在大数据领域(如 Apache Spark)中表现得尤为出色。但从 Java 转到 Scala,就像从平坦的公路驶入蜿蜒的山路,既有风景如画的美好,也有让人晕车的挑战。今天,我们就来聊聊这条转型之路上的异同、不适应的地方以及需要注意的事项。原创 2024-12-08 21:40:28 · 1034 阅读 · 0 评论 -
Apache Flink 如何保证 Exactly-Once 语义
Apache Flink 通过状态一致性检查点和 Two-Phase Commit 协议来确保 Exactly-Once 语义。这些机制确保了数据在分布式系统中的一致性和准确性,从而提高了大数据处理的可靠性和准确性。在实际应用中,我们可以根据具体需求配置 Flink 的检查点策略和外部存储系统的写入策略,以实现更好的性能和可靠性。原创 2024-06-12 11:38:18 · 1208 阅读 · 2 评论 -
那些常忘的ODPS函数用法
前言经常用不会忘记的,我这就不再赘述了函数名函数功能函数定义返回str1中有多少个字符出现在str2中CHR将给定ASCII码ascii转换成字符CONCAT连接字符串KEYVALUE返回key-value对中key所对应的value字符串替换SPLIT_PART根据分隔符拆分字符串SUBSTR返回字符串指定位置指定长度的的子串。字符串替换。原创 2023-12-11 09:37:13 · 2397 阅读 · 0 评论 -
Flink常见面试问题(附答案)
Apache Flink是一个开源的流处理和批处理框架,可以实现快速、可靠、可扩展的大数据处理。窗口是Flink中用于对无限数据流进行有界处理的机制。它将无限流切分为有限的、不重叠的块,并对每个窗口进行计算。。原创 2024-04-07 12:55:17 · 11345 阅读 · 7 评论