- 关于Geotrellis
Geotrellis是一款基于分布式存储和计算的栅格数据处理框架。
- 使用环境说明
1、Python
Geotrellis是基于Scala语言编程实现的,同时Geotrellis也提供了其他编程语言如Python、R语言的开发接口。由于项目的需要,这里使用Python语言,版本选择3.7.3,编译器选择pycharm2019.1。具体的安装和部署过程参见其他教程。
2、Spark
Geotrellis使用分布式计算,所以需要安装Sprak。具体的安装步骤可以参考其他教程,这里不再说明。
Spark环境部署完成后,可以通过spark-submit的方式提交python代码。Python使用spark需要引入spark提供的PySpark包,安装方式:
1)使用pip
pip install pyspark
下载的使用需要指定版本,最好和安装的spark版本一致。比如:pip install pyspark==2.2.0
2)直接下载压缩包,地址:https://pypi.org/project/pyspark/#files

下载后使用pip install 目录\pyspark-2.4.3.tar.gz
我使用的spark版本是2.2.0
3、GeopySpark
Python需要引入Geotrellis提供的Pytho包,下载方式同pyspark。
如:pip install geopyspark=0.2.0
下载完成后需要生成jar包
Geopyspark install -jar
Python的代码最终会调用这些jar包,如下:

说明部署完成。注意geopyspark的版本。

我这里使用的geopyspark版本是0.2.0
至此,基本环境已经部署完成,可以尝试开发了。

本文介绍了基于分布式存储和计算的栅格数据处理框架Geotrellis。使用Python 3.7.3和pycharm2019.1进行开发,因Geotrellis分布式计算需求需安装Spark,还介绍了PySpark和GeopySpark包的安装方式,包括使用pip和下载压缩包,最后完成基本环境部署。
1085





