1. 技术栈介绍
随着互联网技术日益发展,庞大的数据量,传统关系型数据库已无法满足业务需求,需结合Nosql型数据库来应对时空海量数据和业务发展。针对日前互联网外出交通出行,位置点实时监控与轨迹播放等场景,提供一套有效的技术方案来满足需求。本文选型Geomesa+HBase技术栈,教大家搭建一套属于自己的单机版时空大数据环境,自下而上的技术组件介绍,希望能使大家清晰的掌握该组合技术栈。
1.1 Hadoop+HBase
Hbase用于时空数据的存储,实时监控点的更新,以及海量轨迹路线的存储。(感兴趣的博友可以与此对比Orcale、Postgresql数据库)
1.2 Geomesa
GeoMesa是一款开源的基于分布式计算系统的面向海量时空数据查询与分析的工具包,它支持多种可扩展的、基于云端的数据存储架构,包括Apache Accumulo, HBase,Cassandra,Google Bigtable,以及用于流计算的Apache Kafka 。同时GeoMesa还可以和Apache Storm一起处理流数据,并使用Spark进行空间分析。 同时,GeoMesa以GeoServer插件的形式为GeoServer提供了读取GeoMesa表的功能。在GeoServer中,GeoMesa表作为一种数据源存在,通过GeoServer,用户可以通过WMS/WFS的形式访问GeoMesa的数据。
1.3 Geoserver
Geoserver是一款优秀的基于OGC(开放地理信息联盟)标准开发的数据渲染和电子地图生产服务引擎。
1.4 OpenLayers
ol用于电子地图的浏览器端展示,也可选择leaflet、mapbox-gl-js等技术栈
2. 部署环境
2.1 环境依赖

- Ubuntu 16.04(操作系统)
- JDK8
- Maven (3.6.3)
- Tomcat(8.5.38)
- Hadoop(本文使用2.7.5)
- Zookeeper (3.4.9)
- HBase(2.1.0)
- Geomesa-hbase(2.11-3.2.0)
- Geoserver(2.17.2)
2.2 HAPOOP安装
2.2.1 SSH的安装、配置
sudo apt-get install ssh
ssh-keygen -t rsa
cd ~/.ssh
cat id_rsa.pub >> authorized_keys
ssh localhost
2.2.2 下载hadoop压缩包
Index of /dist/hadoop/core/hadoop-2.7.5
2.2.3 命令行解压
tar zxvf hadoop-2.7.5.tar.gz
2.2.4 配置
a. 环境变量配置(可选择hadoop安装路径)
sudo vim /etc/profile
export HADOOP_HOME=/home/ubuntu/soft/hadoop-2.7.5
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
# 更新环境变量
source /etc/profile

本文介绍了一套基于GeoMesa与HBase的技术栈,用于处理互联网出行、位置监控等场景下的时空大数据。详细讲解了环境搭建流程,包括Hadoop、HBase、GeoMesa及GeoServer的配置步骤。
最低0.47元/天 解锁文章
1101





