
分布式技术
持续梳理、总结Spark、Ray、TensorFlow、Pytorch等分布式方面的核心技术知识和工作实践经验。只输出干货,不废话。
tyhj_sf
职业从事ML System研发和管理多年,业余从事AGI研究,跟进AI各流派新观点、学说,致力于实现类人通用智能系统。
展开
-
Spark框架核心原理详解(持续更新)
前面有一篇博客记录了Spark在Windows系统上的安装配置过程,由于工作需要使用了一段时间,这就篇系统地梳理一下Spark框架的核心知识作为备忘。原创 2020-11-09 03:12:23 · 1375 阅读 · 0 评论 -
Windows下Spark2.3+Python3.6+Pycharm的配置
最近项目涉及在spark分布式上做数据处理,需要先配置Spark+Python的本地Windows7(win10也一样的操作)机器上开发环境,所以写下本文备忘,同时希望对其他同学也有所帮助。准备工作spark版本更新比较频繁,也许你看到这篇文章,版本可能已经新增。 当前最新版本的spark为2.3.1,spark的运行需要JDK8以上,所以你需要首先安装jdk8并配置好环境变量。 ...原创 2018-08-21 16:58:52 · 3119 阅读 · 0 评论