
Spark
Spark
xqg1316
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
spark.read.textFile读取.tar.gz文件数据问题
spark.read.textFile()读取.tar.gz文件数据问题 从官网的描述中spark.textFile方法是可以读取压缩文件.tar.gz. 当我测试的时候发现文件从一个文件读取到另外一个文件的时候,spark会在值中加入“文件名 000 ustar root root”放到下个读取文件的第一个行。 我想问一下是我写的有问题还是本来就是这样?如果是如何避免。 ...原创 2020-10-15 16:57:23 · 1587 阅读 · 0 评论 -
Spark2中操作HBase的异常org.apache.hadoop.hbase.HTableDescriptor.addFamily
Spark2中操作HBase的异常org.apache.hadoop.hbase.HTableDescriptor.addFamily... org.apache.hadoop.hbase.HTableDescriptor.addFamily(Lorg/apache/hadoop/hbase/HColumnDescriptor;)Lorg/apache/hadoop/hbase/HTabl...原创 2020-04-30 15:50:57 · 545 阅读 · 0 评论 -
Spark写入hdfs 用csv格式并使用自定义分隔符
解决办法: pom文件加:spark是1.6.0 spark-csv_2.10注意scala的版本与之对应 <!--spark on hive 写入csv格式文件--> <dependency> <groupId>com.databricks</groupId> <artifactId>spark-csv_2.10...原创 2019-11-07 09:30:58 · 4069 阅读 · 0 评论 -
Spark On Hive
Spark1.x 实现 Spark On Hive package spark import org.apache.spark.sql.{DataFrame, SaveMode} import org.apache.spark.sql.hive.HiveContext import org.apache.spark.{SparkConf, SparkContext} /** * ...原创 2019-01-21 14:47:36 · 412 阅读 · 0 评论