最近做一个项目,需要把每天几百亿的经纬度转换为 省市区县 行政区划,尝试了以下几个方案:
- 传统的点在多边形内算法,如射线法等。由于行政区划多边形边界实在是复杂,射线法判断速度太慢,无法满足实际需求。
- 经过调查,发现google s2这个工具包,里面有两种实现方案。
- 方案一,将多边形的经纬度点构建为S2Polygon,使用contains方法,具体实现参考: https://blog.youkuaiyun.com/deng0515001/article/details/88031153, 速度比射线法快,但是由于速度问题依然无法使用。
- 方案二,主要思想:把多边形切成不同大小的S2方块,切分后的S2块能近似拼接成原多边形。
具体实现:将多边形的经纬度点构建为S2Polygon, 使用 S2RegionCoverer的 getCovering 获取到多边形覆盖的所有S2块
的S2CellUnion, 然后使用S2CellUnion的contains方法即可判断
优点:速度极快,平均每次判断为0.02ms左右。
缺点:多边形边缘部分处理精度不足,边缘部分有少量判断错误或者无法判断,最高精度下错误加未知比例约为0.1%。
考虑到当前项目数据量极大,并且要求不能有处理错误问题,尝试使用基于空间查询的方式来判断点在多边形内。
最终效果:速度极快,平均每次判断为0.02ms左右,同时判断准确率优于99.9999%,且没有判断未知情况。
基本思路:找到距离需要判断点的最近的一条多边形的边,那么需要判断的点一定是在这条边所在的两个多边形内,再根据三点的行列式判断旋转方向,从而判断具体是在哪一个多边形内。(这里把不在任何一个多边形内的区域统一算作一个多边形)
实现步骤:
第一步,初始化,将所有的多边形的边转换为一定长度的线段,并用起点做key存储在map中。
第二步,使用空间查询,找到距离当前点最近的一个点
第三步,找到距离最近点所在的最近的线段
第四步,根据三点行列式判断旋转方向,从而判断是在哪一个多边形内。
maven依赖:
<dependency>
<groupId>com.github.deng0515001</groupId>
<artifactId>lnglat2Geo</artifactId>
<version>1.0.5</version>
</dependency>
代码见github:
https://github.com/deng0515001/lnglat2Geo
有问题请联系451408963@qq.com
如果你觉得好用,请帮忙在github上点个赞。你的赞同是我前进的动力,谢谢~。
详细接口文档:
object GeoTrans {
/**
* 按需初始化数据, 因为这里所有数据均使用懒加载方式,离线数据处理时可以不加载该方法,直接调用相应的方法即可
*
* @param needBoundary 是否需要加载边界数据,用于经纬度转换省市区县
* @param needStreet 是否需要加载街道数据
* @param needArea 是否需要加载商圈数据
* @param needCityLevel 是否需要加载城市级别数据
* @return
*/
def init(needBoundary: Boolean = true, needStreet: Boolean = true, needArea: Boolean = false, needCityLevel: Boolean = false): Unit
/**
* 判断经纬度的行政区划
* @param lon 经度
* @param lat 纬度
* @param needStreet 是否需要街道信息
* @param coordSys 输入经纬度的坐标系
* @return 行政区划
*/
def determineAdmin(lon: Double, lat: Double, coordSys: CoordinateSystem, needStreet: Boolean = true): Admin
/**
* 给出附近的所有商圈信息
*
* @param lon 经度
* @param lat 纬度
* @param radius 需要商圈的半径
* @param coordSys 输入经纬度的坐标系
* @param needStreet 是否需要返回行政区划的街道信息
* @return
*/
def aroundBusinessAreas(lon: Double, lat: Double, radius: Int = 4000, coordSys: CoordinateSystem, needStreet: Boolean = true): BusinessAreaInfo
/**
* 给出附近的所有商圈信息
*
* @param lon 经度
* @param lat 纬度
* @param radius 需要商圈的半径
* @param coordSys 输入经纬度的坐标系
* @param cityID 输入城市adcode
* @return
*/
def aroundBusinessAreasByCityID(lon: Double, lat: Double, radius: Int = 4000, coordSys: CoordinateSystem, cityID: Int): Seq[BusinessArea] =
/**
* 获取城市级别
* @param adcodeOrName 城市adcode或者城市名
* @return 城市级别
*/
def getCityLevel(adcodeOrName: String): String
/**
* 根据地区code返回规范数据
* @param adcode 地区code
* @return
*/
def normalizeName(adcode: Int): AdminNode
/**
* 根据地区name返回规范化的地区信息
* @param adcode 地区code
* @return 规范化的地区信息
*/
def normalizeName(name: String, level: DistrictLevel): AdminNode
/**
* 根据所有信息返回规范化的地区信息
*
* @param province 省名 可为空
* @param city 城市名 可为空
* @param district 区县名 可为空
* @param street 街道名 可为空
* @param isFullMatch 所有输入区域是简称还是全名
* @return 规范化的地区信息,可能有多个或不存在
*/
def normalizeName(province: String = "", city: String = "", district: String = "", street: String = "", isFullMatch: Boolean = false): Seq[Admin]
/**
* 获取所有行政区划数据
*
* @return 所有行政区划数据,不包含街道
*/
def adminData() : Map[Int, AdminNode]
def countryCode() : Map[String, String]
def districtBoundary(): Map[Int, Array[Array[Long]]]
}