
DAPT
文章平均质量分 76
Ayu阿予
我敲敲敲敲代码
展开
-
数据处理技术-Spark入门
自学笔记.原创 2024-07-08 11:13:51 · 449 阅读 · 0 评论 -
数据分析与处理技术-题目测试
在Hadoop中,每个应用程序被表示成一个作业,将作业的名称设置为test,用JAVA代码编写,该如何写?用于复习或者自测都很合适。MapReduce过程中,默认情况下,一个分片就是一个数据块,也就是一个map task。Hive可处理大连各数据,它最重视的性能是可测量性,延展性,对于输入格式的宽松匹配性和?随着城市化进程的加深,大数据给我们带来了巨大挑战,可以通过(),实现城市的可持续发展?在Hive中,执行分桶操作,具体哪个值分到哪个桶中,可以对数据进行HASH运算取得.原创 2024-06-18 20:56:27 · 891 阅读 · 0 评论 -
数据处理技术-hive基本操作
复习笔记原创 2024-06-18 19:08:12 · 222 阅读 · 0 评论 -
数据处理技术-Hive的表与数据类型
复习笔记原创 2024-06-17 18:56:13 · 699 阅读 · 0 评论 -
数据处理技术-Hive入门
当大量数据都存放在HDFS上,如何快速对HDFS上的文件进行统计分析操作?肯定能想到的是,通过MapReduce直接对HDFS文件进行操作。但是要完成这个工作,就必须先学Java,再学MapReduce才可以。这对不会Java的数据分析员来说非常不友好。相比于Java的语法,SQL语法简单很多,并且大多数玩数据的多多少少都必须得会点儿数据库的知识,因此使用SQL来对HDFS上的文件进行统计分析操作就成了大势所趋的事情。原创 2024-06-17 12:45:27 · 611 阅读 · 0 评论 -
数据处理技术-MapReduce入门
我们已经复习了Hadoop的HDFS组件。那么另外一个重要的组件MapReduce也必须要介绍一下了。在本篇博客中,我会详细讲解MapReduce的相关概念。原创 2024-04-25 13:07:04 · 737 阅读 · 3 评论 -
数据处理技术-HDFS
如上一篇博客所讲,HDFS是Hadoop的一个组件。HDFS到底用来干甚么?为什么使用它?如何使用它?我将在本篇博客中详细赘述。原创 2024-04-24 13:06:35 · 1173 阅读 · 0 评论 -
数据处理-Hadoop基础概念
Hadoop的两个基础组件是HDFS和MapReduce,同时它采用了分布式集群的方法来应对大数据处理。在本篇博客我将具体阐述Hadoop的相关基础概念。原创 2024-04-23 18:50:45 · 252 阅读 · 0 评论 -
数据分析-存储的模式
复习笔记原创 2024-04-23 18:00:59 · 709 阅读 · 0 评论 -
数据分析与处理技术基础知识
数据数量非常庞大,大到在合理时间内无法通过目前主流软件工具进行相关操作(管理、处理、整理etc.)大数据本质包含数量、类型、速度三个维度的问题。原创 2024-04-19 12:39:44 · 789 阅读 · 0 评论