spark读取parquet文件

最新推荐文章于 2025-04-08 13:35:56 发布

gegeyanxin

最新推荐文章于 2025-04-08 13:35:56 发布

阅读量4.2k

点赞数

分类专栏：工具文章标签： parquet读取查看parquet内容 parquet 内容

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gegeyanxin/article/details/123852590

版权

工具专栏收录该内容

12 篇文章

订阅专栏

1、

进入spark-shell窗口

2、

val sqlContext = new org.apache.spark.sql.SQLContext(sc)

3、

val schema= sqlContext.parquetFile("hdfs://cdp/user/az-user/sparkStreamingKafka2HdfsData/part-00000-ff60a7d3-bf91-4717-bd0b-6731a66b9904-c000.snappy.parquet")
hdfs://cdp是defaultFS，也可以不写，如下:

val parquetFile2 = sqlContext.parquetFile("/user/az-user/sparkStreamingKafka2HdfsData/part-00000-ff60a7d3-bf91-4717-bd0b-6731a66b9904-c000.snappy.parquet")

4、
parquetFile.take(30).foreach(println)

5.查看parquet列名

parquetFile.schema

spark读取parquet文件_qq_43193797的博客-优快云博客_spark读取parquet文件

博客等级

码龄8年

105
原创

165
点赞

306
收藏

82
粉丝

关注

私信

热门文章

分类专栏

工具 12篇
Linux 3篇
计算机基础 1篇
ES 3篇
faust 1篇
hive 2篇
神经网络 1篇
C/C++ 5篇
J
JAVA_SE 16篇
类的封装
继承 1篇
UML图
Mysql 6篇
JAVA_EE 4篇
problem solve 5篇
Hadoop问题解决 11篇
排序 1篇
算法 5篇
hadoop 5篇
鸡汤 1篇
Spark 6篇
scala 2篇
leetCode 14篇
剑指offer 6篇

展开全部收起

上一篇：: spark参数调优各参数的含义

下一篇：: shell exit 1退不出问题

最新评论

Flink消费pubsub问题
gegeyanxin: 试试long呢
Flink消费pubsub问题
weixin_39716941: 我这边pubsub设置了架构，一些decimal datetime的时间类型都会导致我数据无法推送到pubsub，您这边有遇到过么
Flink消费pubsub问题
gegeyanxin: [code=java] DataStream<SomeObject> dataStream = (...); SerializationSchema<SomeObject> serializationSchema = (...); SinkFunction<SomeObject> pubsubSink = PubSubSink.newBuilder() .withSerializationSchema(serializationSchema) .withProjectName("project") .withSubscriptionName("subscription") .build() dataStream.addSink(pubsubSink); [/code] 我看官网上有例子，照着应该很好改。
Flink消费pubsub问题
weixin_39716941: 我这边想实现flink sink pubsub的逻辑有案例么
spark参数调优各参数的含义
iHearter: spark.cross.dc.inputs.location.prefix.substitute.enabled这个参数什么意思？我没搜到呀

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。