
spark
数学工具构造器
这个作者很懒,什么都没留下…
展开
-
spark 机器学习
wget -c http://files.grouplens.org/datasets/movielens/ml-100k.zip原创 2020-01-08 14:02:40 · 281 阅读 · 0 评论 -
pyspark的交互式终端
文章目录ptpythonjupyter notebook ptpython pip install ptpython export PYSPARK_DRIVER_PYTHON=ptpython unset PYSPARK_DRIVER_PYTHON_OPTS export PYSPARK_PYTHON="/root/miniconda3/bin/python" pyspark --master y...原创 2020-01-07 21:47:03 · 643 阅读 · 0 评论 -
spark访问本地文件系统
from pathlib import Path def fn(x): return Path("/etc/hostname").read_text() lst=[1 for i in range(100000)] rdd1=sc.parallelize(lst) rdd2=rdd1.map(fn) rdd3=rdd2.map(lambda x:(x,1)) rdd4=rdd3.re...原创 2020-01-07 21:40:22 · 316 阅读 · 0 评论