自Redis 3.2开始,Redis基于geohash和有序集合提供了地理位置相关功能。Redis Geo模块包含了以下6个命令:
▶GEOADD: 将给定的位置对象(纬度、经度、名字)添加到指定的key;
▶GEOPOS: 从key里面返回所有给定位置对象的位置(经度和纬度);
▶GEODIST: 返回两个给定位置之间的距离;
▶GEOHASH: 返回一个或多个位置对象的Geohash标识;
▶GEORADIUS: 以给定的经纬度为中心,返回目标集合中与中心的距离不超过给定最大距离的所有位置对象;
▶GEORADIUSBYMEMBER: 以给定的位置对象为中新,返回与其距离不超过给定最大距离的所有位置对象。
1.GeoHash算法
GeoHash算法将二维的经纬度数据映射到一维的整数,使得所有的元素挂载到一条线上,距离靠近的二维坐标映射到一维后的点之间距离也会很接近。当想要计算“附近的人”时,将目标位置映射到这条线上,然后在这个一维的线上获取附近的点就好。
那GeoHash是怎么将二维经纬度映射为一维的整数呢?
它将整个地球视为一个二维平面,然后划分成一系列正方形的方格,所有的地图元素坐标被放置于唯一的方格中,方格越小越精确。然后对这些方格进行整数编码,越靠近的方格编码越接近,最简单的编码方法使用切蛋糕法。
如上图所示,类似于切蛋糕的方法,对于每一个正方形,对它切两刀,使其变为四个相同大小的正方形。第一次分成的四个大正方形可以分别记为00、01、10、11。然后对四个大正方形进行切分之后,小正方形可以用4bit整数来表示,随着继续往下切,位数越多,精确度也越高。
编码之后,每个地图元素的坐标都将变成一个整数,通过这个整数可以还原出元素的坐标。
GeoHash算法会继续对这个整数做一次base32编码(0~9, a~z,去掉a、i、l、o)变成一个字符串。在Redis里面,经纬度使用52位的整数进行编码,放进了zset里面,zset的value是元素的key,score是GeoHash的52位整数值。zset的score虽然是浮点数,但是对于52位的整数值,可以无损存储。Redis的进行Geo查询时,它的内部结构实际上只是一个zset,通过zset的score排序就可以得到坐标附近的其他元素,通过将score还原成坐标值就可以得到元素的原始坐标。
2.根据经纬度计算GeoHash二进制编码
地球纬度区间是[-90,90], 北海公园的纬度是39.928167,可以通过下面算法对纬度39.928167进行逼近编码:
区间[-90,90]进行二分为[-90,0),[0,90],称为左右区间,可以确定39.928167属于右区间[0,90],给标记为1;接着将区间[0,90]进行二分为 [0,45),[45,90],可以确定39.928167属于左区间 [0,45),给标记为0;递归上述过程39.928167总是属于某个区间[a,b]。随着每次迭代区间[a,b]总在缩小,并越来越逼近39.928167;如果给定的纬度x(39.928167)属于左区间,则记录0,如果属于右区间则记录1,这样随着算法的进行会产生一个序列1011100,序列的长度跟给定的区间划分次数有关。
39.928167 根据纬度算编码
同理,地球经度区间是[-180,180],可以对经度116.389550进行编码。根据经度算编码
3、组码
通过上述计算,纬度产生的编码为10111 00011,经度产生的编码为11010 01011。偶数位放经度,奇数位放纬度,把2串编码组合生成新串:11100 11101 00100 01111。最后使用用0-9、b-z(去掉a, i, l, o)这32个字母进行base32编码,首先将11100 11101 00100 01111转成十进制,对应着28、29、4、15,十进制对应的编码就是wx4g。同理,将编码转换成经纬度的解码算法与之相反,具体不再赘述。
4.GeoHash Base32编码长度与精度
可以看出,当geohash base32编码长度为8时,精度在19米左右,而当编码长度为9时,精度在2米左右,编码长度需要根据数据情况进行选择。
经纬度距离换算
在纬度相等的情况下:
经度每隔0.00001度,距离相差约1米;每隔0.0001度,距离相差约10米;每隔0.001度,距离相差约100米;每隔0.01度,距离相差约1000米;每隔0.1度,距离相差约10000米。在经度相等的情况下:
纬度每隔0.00001度,距离相差约1.1米;每隔0.0001度,距离相差约11米;每隔0.001度,距离相差约111米;每隔0.01度,距离相差约1113米;每隔0.1度,距离相差约11132米。
5.Geo指令的基本用法
geoadd key longitude latitude member #添加(经度,纬度,名称)三元组
geodist key member1 member2 [unit] #计算两个元素之间的距离
geopos key member #获取集合中任意元素的经纬度坐标
可以看到,获取到的经纬度坐标和geoadd进去的坐标是有些误差的,因为GeoHash对二维坐标进行的一维映射是有损的,通过映射再还原回来的值会出现较小差别。
geohash key member #获取元素的经纬度编码字符串
获取到的编码字符串可以上http://geohash.org/${hash}上进行定位
georadiusbymember key member radius m|km|ft|mi [WITHCOORD] [WITHDIST] [WITHHASH] #查询指定元素附近的其他元素
georadius key longtitude latitude radius m|km|ft|mi [WITHCOORD] [WITHDIST] [WITHHASH] #查询指定坐标值附近的元素
除了这六个redis提供的Geo指令外,由于它是一个zset,因而zset的操作指令它也可以用到