自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

legotime的博客

个人博客：www.ryanbing.com

博客等级

码龄10年

70
原创

245
点赞

234
收藏

95
粉丝

关注

私信

热门文章

分类专栏

最新评论

Spark从外部读取数据之textFile
kikilada: 嗯？看这个回答感觉源数据大小为300M，textFile读出来之后数据大小也为300M，但层主是问textFile读出来的数据大于300M了
Spark从外部读取数据之textFile
加工费学技术: spark可以读取其他节点的数据吗？这个格式要怎么写，楼主有考虑过吗？
Spark从外部读取数据之textFile
我的猪仔队友: spark能否读取远程linux机器上存储的文件？？
Spark从外部读取数据之textFile
doufanfan 回复 Light Gao: 你好，我在看别人的博文https://www.jianshu.com/p/4b7d07e754fa里面是说：spark读取本地和hdfs所生成的dataframe或者rdd的分区数=max（本地file的分片数/hdfs的block的数量，sc.defaultMinPartitions）。这个结论和你的回答主要就还是在“疑问2，若文件大小为180MB，minPartitions设置为3时，将分成几个partition呢？”上面有分歧，请问哪种是对的？
spark源码阅读笔记Dataset（三）structField、structType、schame
BraveAsta: 感谢分享

hadoop生态

关注

文章平均质量分 87

关注数：文章数：3 文章阅读量：4424 文章收藏量：2

作者: legotime

这个作者很懒，什么都没留下…

展开

专栏收录文章