
大数据
一位不愿透露姓名的肥宅
超级懒散,什么都做不好,还很怕生!
展开
-
构建sparkSession工具类
【代码】构建sparkSession工具类。原创 2023-03-08 13:43:53 · 584 阅读 · 0 评论 -
spark写入Hbase工具类
【代码】spark写入Hbase工具类。原创 2023-03-08 13:42:24 · 193 阅读 · 0 评论 -
spark on yarn falling back to uploading libraries under SPARK_HOME.
spark-shell底层是调用的spark-submit,每次运行时都会把yarn所需的spark jar打包上传至HDFS,然后分发到每个NM。如果我们将jar包提前上传至HDFS,那么spark在运行时就不用上传,可以直接从HDFS读取了。重新运行 spark-shell --master yarn-client。在以yarn作为master启动sparkshell出现警告。在spark-default.conf文件中添加。将jar包上传至hdfs目录。原创 2023-02-13 06:32:43 · 233 阅读 · 0 评论 -
spark on yarn配置安装
配置环境变量,在/etc/profile文件中添加以下内容并重新加载配置文件(source /etc/profile)进入spark/conf配置目录新建spark-env.sh文件(vim spark-env.sh)并加入以下内容。将下载好的压缩包传入虚拟机的安装路径,本文章为/soft目录。进入spark安装目录输入以下内容成功返回pi的值则配置成功。原创 2023-02-13 05:36:02 · 906 阅读 · 0 评论 -
Linux安装Hive
上传jdbc驱动包到/soft/hive/lib文件夹下并保证mysql中有名为hive的数据库。这可能是因为jdbc版本问题导致的,在确保hive/lib目录下有jdbc驱动包后可以参考一下。这里mysql版本为5.7,请下载你mysql对应版本的jdbc驱动。将安装包上传至/soft目录并解压改名。需要提前安装hadoop与mysql。输入 show databases;确保hadoop启动后启动hive。,这里可能有人会遇到。修改hive环境变量。原创 2023-02-12 06:33:26 · 124 阅读 · 0 评论 -
Linux压缩包形式安装MySQL5.7
Linux压缩包形式安装mysql5.7原创 2023-02-11 17:56:30 · 300 阅读 · 0 评论 -
Linux伪分布式安装Hadoop2.7.7
hadoop2.7.7在Linux系统进行伪分布式安装原创 2023-02-11 06:33:56 · 237 阅读 · 0 评论 -
Linux安装Scala与Java
在linux环境下安装scala与java的详细步骤原创 2023-02-10 22:25:43 · 179 阅读 · 1 评论