pyspark
文章平均质量分 61
moledyzhang
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
在notebook中使用pyspark遇到的问题
代码:from pyspark import SparkContextsc = SparkContext()rdd.getNumPartitions()rdd.glom().collect()遇到的问题: 执行rdd.glom().collect()时出现如下错误:Py4JJavaError: An error occurred while calling z:org.apache.spar原创 2017-12-20 19:04:57 · 7781 阅读 · 0 评论 -
用spark做web日志分析
本文以服务器日志分析为例,给大家展示真实场景中,怎么用pySpark去完成大数据的处理和分析的。总述这里的应用主要包括4部分: Part 1: Apache Web服务器日志格式 Part 2: web服务器日志初步解析 Part 3: web服务器日志进一步解析和可视化 Part 4: 对返回404的结果做分析part 1 Apache Web服务器日志格式这里用到的服务器日志格式是 Ap原创 2018-01-04 15:36:02 · 6204 阅读 · 0 评论
分享