2020-12-17

好记忆不如烂笔头,能记下点东西,就记下点,有时间拿出来看看,也会发觉不一样的感受.

目录

Redis 的八大数据类型

1、String(字符串)

2、List(列表)

3、Set (集合)

4、Hash(哈希)

5、zset (有序集合)

6、geospatial

7、hyperloglog

8、bitmap 位图


都以为redis只有5种数据类型,哈哈,you are wrong ,you are wrong !
其实,redis早就在不断变化和更新了,现在人家已经足足有8种数据类型了,先我们来逐一了解下。

废话不多说,看招:

 

Redis 的八大数据类型

官网可查看命令:http://www.redis.cn/commands.html

Redis-key

127.0.0.1:6379> keys *
(empty list or set)
127.0.0.1:6379> set name xxx
OK
127.0.0.1:6379> keys *
1) "name"127.0.0.1:6379> set age 1
OK
127.0.0.1:6379> keys *
1) "age"2) "name"127.0.0.1:6379> exists name  # 判断key 是否存在(integer) 1
127.0.0.1:6379> exists name1
(integer) 0
127.0.0.1:6379> move name 1
(integer) 1
127.0.0.1:6379> keys *
1) "age"127.0.0.1:6379> set name yyy
OK
127.0.0.1:6379> expire name 10  # 设置key的过期时间,单位是秒(integer) 1
127.0.0.1:6379> ttl name  # 查看当前key的剩余过期时间(integer) 7
127.0.0.1:6379> ttl name
(integer) -2
127.0.0.1:6379> type age  # 查看当前key的类型string
127.0.0.1:6379>

Redis 有以下 8 种数据类型

1、String(字符串)

127.0.0.1:6379> set key1 v1   #设置值OK
127.0.0.1:6379> get key1"v1"127.0.0.1:6379> append key1 "hello"  # 追加值,如果不存在,相当于 set key(integer) 7
127.0.0.1:6379> get key1"v1hello"127.0.0.1:6379> strlen key1  # 获取字符串长度(integer) 7
127.0.0.1:6379>

自增、自减

127.0.0.1:6379> set views 0
OK
127.0.0.1:6379> get views"0"127.0.0.1:6379> incr views  # 自增 1(integer) 1
127.0.0.1:6379> get views"1"127.0.0.1:6379> decr views       # 自减 1(integer) 0
127.0.0.1:6379> decr views
(integer) -1
127.0.0.1:6379> get views"-1"127.0.0.1:6379> incrby views 10  # 设置步长、自增 10 (integer) 9
127.0.0.1:6379> decrby views 5      # 设置步长、自减 5(integer) 4

字符串范围

127.0.0.1:6379> set key1 "hello,world!"OK
127.0.0.1:6379> get key1"hello,world!"127.0.0.1:6379> getrange key1 0 3  # 截取字符串\[0, 3\]"hell"127.0.0.1:6379> getrange key1 0 -1  # 获取全部的字符串,和 get key一样"hello,world!"127.0.0.1:6379>

替换:

127.0.0.1:6379> set key2 abcdefg
OK
127.0.0.1:6379> get key2"abcdefg"127.0.0.1:6379> setrange key2 1 xx
(integer) 7
127.0.0.1:6379> get key2"axxdefg"127.0.0.1:6379>

setex(set with expire):设置过期时间

setnx(set if not exist):不存在再设置(在分布式锁中会经常使用)

127.0.0.1:6379> setex key3 30 "hello"  # 设置 30 秒后过期OK
127.0.0.1:6379> ttl key3     # 剩余过期时间(integer) 25
127.0.0.1:6379> setnx mykey "redis"   # mykey 不存在时设置成功(integer) 1
127.0.0.1:6379> keys *
1) "key2"2) "key1"3) "views"4) "mykey"127.0.0.1:6379> setnx mykey "mongoDB"  # mykey 存在时设置失败(integer) 0
127.0.0.1:6379> get mykey     # mykey 值不变"redis"127.0.0.1:6379>

mset 和 mget

127.0.0.1:6379> mset k1 v1 k2 v2 k3 v3  # 同时设置多个值OK
127.0.0.1:6379> keys *
1) "k1"2) "k3"3) "k2"127.0.0.1:6379> mget k1 k2 k3   # 同时获取多个值1) "v1"2) "v2"3) "v3"127.0.0.1:6379> msetnx k1 v1 k4 v4       # msetnx 是一个原子性的操作,要么一起成功,要么都失败(integer) 0
127.0.0.1:6379> get k4
(nil)
127.0.0.1:6379>

对象

set user:1 {name:zhangsan, age:3}     # 设置一个 user:1 对象 值为 json  字符来保存一个对象127.0.0.1:6379> mset user:1:name zhangsan user:1:age 2
OK
127.0.0.1:6379> mget user:1:name user:1:age
1) "zhangsan"2) "2"127.0.0.1:6379>

getset:先 get 再 set

127.0.0.1:6379> getset db redis  # 如果不存在值,则返回 nil(nil)
127.0.0.1:6379> get db"redis"127.0.0.1:6379> getset db mongodb  # 如果存在值,获取原来的值,并设置新的值"redis"127.0.0.1:6379> get db"mongodb"127.0.0.1:6379>

String 的使用场景:value 除了是字符串以外还可以是数字

  • 计数器

  • 统计多单位的数量

  • 粉丝数

  • 对象缓存存储

2、List(列表)

基本的数据类型,列表。

在 Redis 中可以把 list 用作栈、队列、阻塞队列。

list 命令多数以 l开头。

127.0.0.1:6379> lpush list one   # 将一个值或者多个值,插入到列表的头部(左)(integer) 1
127.0.0.1:6379> lpush list two
(integer) 2
127.0.0.1:6379> lpush list three 
(integer) 3
127.0.0.1:6379> lrange list 0 -1   # 查看全部元素1) "three"2) "two"3) "one"127.0.0.1:6379> lrange list 0 1    # 通过区间获取值1) "three"2) "two"127.0.0.1:6379> rpush list right   # 将一个值或者多个值,插入到列表的尾部(右)(integer) 4
127.0.0.1:6379> lrange list 0 -1
1) "three"2) "two"3) "one"4) "right"127.0.0.1:6379>

弹出 pop

127.0.0.1:6379> lrange list 0 -1
1) "!"2) "world"3) "world"4) "hello"127.0.0.1:6379> lpop list  # 移除list的第一个元素"!"127.0.0.1:6379> lrange list 0 -1
1) "world"2) "world"3) "hello"127.0.0.1:6379> rpop list   # 移除list的第一个元素"hello"127.0.0.1:6379> lrange list 0 -1
1) "world"2) "world"127.0.0.1:6379>

索引 Lindex

127.0.0.1:6379> lrange list 0 -1
1) "hjk"2) "world"3) "world"127.0.0.1:6379> lindex list 1  # 通过下标获取list中的某一个值"world"127.0.0.1:6379> lindex list 0"hjk"127.0.0.1:6379>

Llen 长度:

127.0.0.1:6379> llen list
(integer) 3
127.0.0.1:6379>

移除指定的值:

127.0.0.1:6379> lrange list 0 -1
1) "hjk"2) "world"3) "world"127.0.0.1:6379> lrem list 1 world  # 移除list集合中指定个数的value,精确匹配(integer) 1
127.0.0.1:6379> lrange list 0 -1
1) "hjk"2) "world"127.0.0.1:6379> lpush list hjk
(integer) 3
127.0.0.1:6379> lrange list 0 -1
1) "hjk"2) "hjk"3) "world"127.0.0.1:6379> lrem list 2 hjk
(integer) 2
127.0.0.1:6379> lrange list 0 -1
1) "world"127.0.0.1:6379>

trim 截断

127.0.0.1:6379> lrange mylist 0 -1
1) "hello1"2) "hello2"3) "hello3"4) "hello4"127.0.0.1:6379> ltrim mylist 1 2 # 通过下标截取指定长度,这个list已经被破坏了,截断之后只剩下截断后的元素OK
127.0.0.1:6379> lrange mylist 0 -1
1) "hello2"2) "hello3"127.0.0.1:6379>

rpoplpush :移除列表的最后一个元素,将他移动到新的列表中。

127.0.0.1:6379> lrange mylist 0 -1
1) "hello1"2) "hello2"3) "hello3"127.0.0.1:6379> rpoplpush mylist myotherlist  # 移除列表的最后一个元素,将他移动到新的列表中。"hello3"127.0.0.1:6379> lrange mylist 0 -1  # 查看原来的列表1) "hello1"2) "hello2"127.0.0.1:6379> lrange myotherlist 0 -1  # 查看目标列表中,确实存在该值1) "hello3"127.0.0.1:6379>

lset:将列表中指定下标的值替换为另一个值,更新操作

127.0.0.1:6379> exists list  # 判断这个列表是否存在(integer) 0
127.0.0.1:6379> lset list 0 item  # 如果不存在的话,更新会报错(error) ERR no such key
127.0.0.1:6379> lpush list value1
(integer) 1
127.0.0.1:6379> lrange list 0 0 
1) "value1"127.0.0.1:6379> lset list 0 item  # 如果存在,更新当前下标的值OK
127.0.0.1:6379> lset list 1 other  # 如果不存在的话,更新会报错(error) ERR index out of range
127.0.0.1:6379>

linsert:将某个具体的value插入到列表中某个元素的前面或者后面

127.0.0.1:6379> lrange mylist 0 -1
1) "hello1"2) "hello2"127.0.0.1:6379> linsert mylist before "hello2" hello
(integer) 3
127.0.0.1:6379> lrange mylist 0 -1
1) "hello1"2) "hello"3) "hello2"127.0.0.1:6379> linsert mylist after "hello2" hello
(integer) 4
127.0.0.1:6379> lrange mylist 0 -1
1) "hello1"2) "hello"3) "hello2"4) "hello"127.0.0.1:6379>

小结

  • list 实际上是一个链表,前后都可以插入

  • 如果key不存在,创建新的链表

  • 如果移除了所有的值,空链表,也代表不存在

  • 在两边插入或者改动值,效率最高。

3、Set (集合)

127.0.0.1:6379> sadd myset "hello"  # set 集合中添加元素(integer) 1
127.0.0.1:6379> sadd myset "world"(integer) 1
127.0.0.1:6379> smembers myset      # 查看指定Set的所有值1) "world"2) "hello"127.0.0.1:6379> sismember myset hello  # 判断某一个值是不是在set中(integer) 1
127.0.0.1:6379> sismember myset hello1
(integer) 0
127.0.0.1:6379>
127.0.0.1:6379> scard myset  # 获取集合中的个数(integer) 2
127.0.0.1:6379> sadd myset "hello2"(integer) 1
127.0.0.1:6379> smembers myset   
1) "world"2) "hello2"3) "hello"127.0.0.1:6379> srem myset hello   # 移除元素(integer) 1
127.0.0.1:6379> smembers myset
1) "world"2) "hello2"127.0.0.1:6379>
127.0.0.1:6379> smembers myset
1) "kkk"2) "world"3) "hjk"4) "hello2"127.0.0.1:6379> srandmember myset   # 随机抽取一个元素"hjk"127.0.0.1:6379> srandmember myset"hello2"127.0.0.1:6379> srandmember myset 2   # 随机抽取指定个数的元素1) "world"2) "hello2"127.0.0.1:6379> srandmember myset 2
1) "hello2"2) "hjk"127.0.0.1:6379>
127.0.0.1:6379> smembers myset
1) "kkk"2) "world"3) "hjk"4) "hello2"127.0.0.1:6379> spop myset  # 随机删除元素"hjk"127.0.0.1:6379> smembers myset
1) "kkk"2) "world"3) "hello2"127.0.0.1:6379> spop myset"hello2"127.0.0.1:6379> smembers myset
1) "kkk"2) "world"127.0.0.1:6379>
127.0.0.1:6379> smembers myset
1) "kkk"2) "world"127.0.0.1:6379> sadd myset2 set2
(integer) 1
127.0.0.1:6379> smove myset myset2 "kkk"   # 将一个特定的值,移动到另一个set集合中(integer) 1
127.0.0.1:6379> smembers myset
1) "world"127.0.0.1:6379> smembers myset2
1) "kkk"2) "set2"127.0.0.1:6379>
127.0.0.1:6379> smembers key1
1) "b"2) "a"3) "c"127.0.0.1:6379> smembers key2
1) "e"2) "d"3) "c"127.0.0.1:6379> sdiff key1 key2   # 差集1) "b"2) "a"127.0.0.1:6379> sinter key1 key2         # 交集1) "c"127.0.0.1:6379> sunion key1 key2  # 并集1) "e"2) "a"3) "c"4) "d"5) "b"

4、Hash(哈希)

也是 key - value 形式的,但是value 是一个map。

127.0.0.1:6379> hset myhash field xxx  # set 一个 key-value(integer) 1
127.0.0.1:6379> hget myhash field   # 获取一个字段值"xxx"127.0.0.1:6379> hmset myhash field1 hello field2 world  # set 多个 key-valueOK
127.0.0.1:6379> hmget myhash field field1 field2   # 获取多个字段值1) "xxx"2) "hello"3) "world"127.0.0.1:6379> hgetall myhash    # 获取全部的数据1) "field"2) "xxx"3) "field1"4) "hello"5) "field2"6) "world"
127.0.0.1:6379> hdel myhash field1  # 删除指定的key,对应的value也就没有了(integer) 1
127.0.0.1:6379> hgetall myhash
1) "field"2) "xxx"3) "field2"4) "world"127.0.0.1:6379>
127.0.0.1:6379> hlen myhash  # 获取长度(integer) 2
127.0.0.1:6379> hexists myhash field1   # 判断指定key是否存在(integer) 0
127.0.0.1:6379> hexists myhash field2
(integer) 1
127.0.0.1:6379> hkeys myhash  # 获取所有的key1) "field"2) "field2"127.0.0.1:6379> hvals myhash  # 获取所有的value1) "xxx"2) "world"127.0.0.1:6379>
127.0.0.1:6379> hset myhash field3 5
(integer) 1
127.0.0.1:6379> hincrby myhash field3 1  # 指定增量(integer) 6
127.0.0.1:6379> hincrby myhash field3 -1
(integer) 5
127.0.0.1:6379> hsetnx myhash field4 hello  # 如果不存在则可以设置(integer) 1
127.0.0.1:6379> hsetnx myhash field4 world  # 如果存在则不能设置(integer) 0
127.0.0.1:6379>

Hash 适合存储经常变动的对象信息,String 更适合于存储字符串。关注公众号Java技术栈,回复 Redis,可以获取我整理的 Redis 系列教程。

5、zset (有序集合)

127.0.0.1:6379> zadd myset 1 one  # 添加一个值(integer) 1
127.0.0.1:6379> zadd myset 2 two 3 three # 添加多个值(integer) 2
127.0.0.1:6379> zrange myset 0 -1
1) "one"2) "two"3) "three"127.0.0.1:6379>

实现排序:

127.0.0.1:6379> zadd salary 2500 xiaohong
(integer) 1
127.0.0.1:6379> zadd salary 5000 xiaoming
(integer) 1
127.0.0.1:6379> zadd salary 500 xaiozhang
(integer) 1
127.0.0.1:6379> zrange salary 0 -1
1) "xaiozhang"2) "xiaohong"3) "xiaoming"127.0.0.1:6379> zrangebyscore salary -inf +inf  # 从小到大显示全部的用户1) "xaiozhang"2) "xiaohong"3) "xiaoming"127.0.0.1:6379> zrevrange salary 0 -1  # 从大到小进行排序1) "xiaoming"2) "xiaohong"3) "xaiozhang"127.0.0.1:6379> zrangebyscore salary -inf +inf withscores   # 附带成绩的显示所有用户1) "xaiozhang"2) "500"3) "xiaohong"4) "2500"5) "xiaoming"6) "5000"127.0.0.1:6379> zrangebyscore salary -inf 2500 withscores   # 显示工资小于 2500 的用户1) "xaiozhang"2) "500"3) "xiaohong"4) "2500"
127.0.0.1:6379> zrange salary 0 -1
1) "xaiozhang"2) "xiaohong"3) "xiaoming"127.0.0.1:6379> zrem salary xiaohong  # 移除特定元素(integer) 1
127.0.0.1:6379> zrange salary 0 -1
1) "xaiozhang"2) "xiaoming"127.0.0.1:6379> zcard salary  # 获取有序集合的个数(integer) 2
127.0.0.1:6379>
127.0.0.1:6379> zadd myset 1 hello
(integer) 1
127.0.0.1:6379> zadd myset 2 world 3 !
(integer) 2
127.0.0.1:6379> zcount myset 1 3  # 获取指定区间的人员数量(integer) 3
127.0.0.1:6379> zcount myset 1 2
(integer) 2

6、geospatial

Redis 在 3.2 推出 Geo 类型,该功能可以推算出地理位置信息,两地之间的距离。

文档:https://www.redis.net.cn/order/3687.html

借助网站模拟一些数据:http://www.jsons.cn/lngcode/

geoadd 添加地理位置

规则:两极无法直接添加,一般会下载城市数据,直接通过 Java 程序一次性导入。

有效的经度从 -180 度到 180 度。有效的纬度从 -85.05112878 度到 85.05112878 度。当坐标位置超出指定范围时,该命令将会返回一个错误。

(error) ERR invalid longitude latitude pair xxx yyy

添加一些模拟数据:

127.0.0.1:6379> geoadd china:city 116.40 39.90 beijing
(integer) 1
127.0.0.1:6379> geoadd china:city 121.47 31.23 shanghai
(integer) 1
127.0.0.1:6379> geoadd china:city 106.50 29.53 chongqing 114.05 22.52 shengzhen
(integer) 2
127.0.0.1:6379> geoadd china:city 120.16 30.24 hangzhou 108.96 34.26 xian
(integer) 2
127.0.0.1:6379>

geopos 获得当前定位坐标值

127.0.0.1:6379> geopos china:city beijing  # 获得指定城市的经纬度1) 1) "116.39999896287918091"
   2) "39.90000009167092543"127.0.0.1:6379> geopos china:city shanghai
1) 1) "121.47000163793563843"
   2) "31.22999903975783553"127.0.0.1:6379>

geodist 获取两个位置之间的距离

单位:

  • m 表示单位为米。

  • km 表示单位为千米。

  • mi 表示单位为英里。

  • ft 表示单位为英尺。

如果用户没有显式地指定单位参数, 那么 GEODIST 默认使用米作为单位。

127.0.0.1:6379> geodist china:city beijing shanghai km # 查看北京和上海直接的直线距离"1067.3788"127.0.0.1:6379> geodist china:city beijing chongqing km"1464.0708"127.0.0.1:6379>

georedius 以给定的经纬度为中心,找出某一半径内的元素

127.0.0.1:6379> georadius china:city 110 30 1000 km # 以110, 30 这个点为中心,寻找方圆 1000km 的城市1) "chongqing"2) "xian"3) "shengzhen"4) "hangzhou"127.0.0.1:6379> georadius china:city 110 30 500 km 
1) "chongqing"2) "xian"127.0.0.1:6379> georadius china:city 110 30 500 km withcoord #  显示他人的定位信息1) 1) "chongqing"
   2) 1) "106.49999767541885376"
      2) "29.52999957900659211"2) 1) "xian"
   2) 1) "108.96000176668167114"
      2) "34.25999964418929977"127.0.0.1:6379> 
127.0.0.1:6379> georadius china:city 110 30 500 km withdist #  显示到中心点的距离1) 1) "chongqing"
   2) "341.9374"2) 1) "xian"
   2) "483.8340"127.0.0.1:6379> georadius china:city 110 30 500 km withdist withcoord count 1  # 指定数量1) 1) "chongqing"
   2) "341.9374"
   3) 1) "106.49999767541885376"
      2) "29.52999957900659211"127.0.0.1:6379> georadius china:city 110 30 500 km withdist withcoord count 2
1) 1) "chongqing"
   2) "341.9374"
   3) 1) "106.49999767541885376"
      2) "29.52999957900659211"2) 1) "xian"
   2) "483.8340"
   3) 1) "108.96000176668167114"
      2) "34.25999964418929977"127.0.0.1:6379>

GEORADIUSBYMEMBER 找出位于指定元素周围的其他元素

127.0.0.1:6379> georadiusbymember china:city shanghai 1000 km
1) "hangzhou"2) "shanghai"127.0.0.1:6379>

geo 底层实现原理其实就是 zset ,可以使用 zset 命令操作 geo

127.0.0.1:6379> zrange china:city 0 -1
1) "chongqing"2) "xian"3) "shengzhen"4) "hangzhou"5) "shanghai"6) "beijing"127.0.0.1:6379> zrem china:city beijing  # 删除一个元素(integer) 1
127.0.0.1:6379> zrange china:city 0 -1
1) "chongqing"2) "xian"3) "shengzhen"4) "hangzhou"5) "shanghai"127.0.0.1:6379>

7、hyperloglog

基数:数学上集合的元素个数,是不能重复的。

UV(Unique visitor):是指通过互联网访问、浏览这个网页的自然人。访问的一个电脑客户端为一个访客,一天内同一个访客仅被计算一次。

Redis 2.8.9 版本更新了 hyperloglog 数据结构,是基于基数统计的算法。

hyperloglog 的优点是占用内存小,并且是固定的。存储 2^64 个不同元素的基数,只需要 12 KB 的空间。但是也可能有 0.81% 的错误率。

这个数据结构常用于统计网站的 UV。传统的方式是使用 set 保存用户的ID,然后统计 set 中元素的数量作为判断标准。

但是这种方式保存了大量的用户 ID,ID 一般比较长,占空间,还很麻烦。我们的目的是计数,不是保存数据,所以这样做有弊端。但是如果使用 hyperloglog 就比较合适了。

127.0.0.1:6379> pfadd mykey a b c d e f g h i j # 创建第一组元素(integer) 1
127.0.0.1:6379> PFCOUNT mykey     # 统计 mykey 基数(integer) 10
127.0.0.1:6379> PFADD mykey2 i j z x c v b n m  # 创建第二组元素(integer) 1
127.0.0.1:6379> PFCOUNT mykey2     # 统计 mykey2 基数(integer) 9
127.0.0.1:6379> PFMERGE mykey3 mykey mykey2  # 合并两组 mykey mykey2 => mykey3OK
127.0.0.1:6379> PFCOUNT mykey3
(integer) 15
127.0.0.1:6379>

8、bitmap 位图

bitmap就是通过最小的单位bit来进行0或者1的设置,表示某个元素对应的值或者状态。一个bit的值,或者是0,或者是1;也就是说一个bit能存储的最多信息是2。

bitmap 常用于统计用户信息比如活跃粉丝和不活跃粉丝、登录和未登录、是否打卡等。

这里使用一周打卡的案例说明其用法:

127.0.0.1:6379> setbit sign 0 1  # 周一打卡了(integer) 0
127.0.0.1:6379> setbit sign 1 0  # 周二未打卡(integer) 0
127.0.0.1:6379> setbit sign 2 0  # 周三未打卡(integer) 0
127.0.0.1:6379> setbit sign 3 1
(integer) 0
127.0.0.1:6379> setbit sign 4 1
(integer) 0
127.0.0.1:6379> setbit sign 5 1
(integer) 0
127.0.0.1:6379> setbit sign 6 0
(integer) 0
127.0.0.1:6379>

查看某一天是否打卡:

127.0.0.1:6379> GETBIT sign 3
(integer) 1
127.0.0.1:6379> GETBIT sign 6
(integer) 0
127.0.0.1:6379>

统计:统计打卡的天数

127.0.0.1:6379> BITCOUNT sign
(integer) 4
127.0.0.1:6379>

 

 

感谢你提供的列名信息,我们可以看到: - `"...1"`:可能是 Excel 中第一列无标题的自动命名(比如行号或空列),可以忽略。 - `"STATION"`:站点编号 - `"NAME"`:站点名称 - `"LATITUDE"`:纬度 - `"LONGITUDE"`:经度 - `"ELEVATION"`:海拔 - `"statement"`:可能是一个状态或注释字段 - 后续从 `"2020-01-01"` 到 `"2020-01-31"` 是每日风速数据(共31天) --- ### ✅ 目标更新: 你要做的是:**根据给定的 SHP 范围裁剪站点,保留落在该地理范围内的所有站点及其完整的逐日风速数据。** 下面是适配你实际列名的完整 R 语言代码,并处理好坐标、投影和数据结构问题。 ```r # 加载所需包 library(sf) library(readxl) library(dplyr) # ------------------- 参数设置 ------------------- excel_file <- "your_wind_station_data.xlsx" # 替换为你的实际文件路径 sheet_name <- "Sheet1" # 替换为你的工作表名 shp_file <- "your_boundary.shp" # 替换为你的SHP文件路径 # ------------------- 步骤1: 读取Excel数据 ------------------- df <- read_excel(excel_file, sheet = sheet_name) # 查看列名确认 names(df) <- make.names(names(df)) # 确保列名是合法的(防止空格等问题) cat("原始列名:\n"); print(names(df)) # ------------------- 步骤2: 提取空间信息并创建sf对象 ------------------- # 使用 LATITUDE 和 LONGITUDE 创建空间点(注意:顺序是 LON, LAT) stations_sf <- st_as_sf(df, coords = c("LONGITUDE", "LATITUDE"), # 经度在前,纬度在后 crs = 4326, # WGS84 地理坐标系 dim = "XY") # ------------------- 步骤3: 读取SHP边界并确保其CRS ------------------- boundary <- st_read(shp_file) # 如果boundary不是投影坐标系(如EPSG:32649),则需要检查并转换 # 假设你知道目标投影是 UTM Zone 49N (EPSG:32649),我们统一到这个坐标系进行空间操作 if (is.na(st_crs(boundary))) { stop("SHP文件没有坐标系信息,请先定义正确的CRS!") } # 将站点数据重投影到与SHP相同的坐标系下进行空间判断 stations_projected <- st_transform(stations_sf, crs = st_crs(boundary)) # ------------------- 步骤4: 空间裁剪 —— 找出在SHP范围内的站点 ------------------- # 使用 st_intersects 或 st_within 进行空间子集提取 # 这里使用 [s,t] 语法:返回落在任意多边形内的站点 stations_clipped <- stations_projected[boundary, , op = st_intersects] # 若你想更严格地要求“完全包含”,可用 st_within,但通常 st_intersects 更通用 # ------------------- 步骤5: 转回原始经纬度并提取属性表格 ------------------- # 将结果转回WGS84以便保留原始经纬度格式输出 stations_wgs84 <- st_transform(stations_clipped, crs = 4326) # 去掉geometry列,恢复为普通data.frame,同时保留原始所有列(包括每日数据) result_df <- st_drop_geometry(stations_wgs84) # 可选:重新排序列,把时间序列放在后面 date_cols <- grep("^\\d{4}-\\d{2}-\\d{2}", names(result_df), value = TRUE) non_date_cols <- setdiff(names(result_df), date_cols) final_df <- select(result_df, c(non_date_cols, date_cols)) # 按逻辑排序 # ------------------- 步骤6: 导出结果 ------------------- write.csv(final_df, "clipped_stations_202001.csv", row.names = FALSE, na = "") cat("共保留了", nrow(final_df), "个站点在SHP范围内。\n") ``` --- ### ✅ 关键说明: | 功能 | 说明 | |------|------| | `coords = c("LONGITUDE", "LATITUDE")` | 必须是 **经度在前,纬度在后**,否则位置错误! | | `crs = 4326` | 表示输入的经纬度使用 WGS84 坐标系 | | `st_transform(...)` | 将点从地理坐标(度)转为投影坐标(米),确保与 SHP 在同一空间参考下比较 | | `st_intersects` | 判断点是否与多边形相交(即落在内部),适用于大多数情况 | | `st_drop_geometry()` | 移除空间结构,得到纯数据框用于导出 | > 💡 输出的 CSV 文件将包含原始所有列,包括 `STATION`, `NAME`, `LATITUDE`, `LONGITUDE`, `ELEVATION`, `statement` 和所有日期列(如 `2020-01-01` 等),仅保留位于 SHP 范围内的站点。 --- ### ✅ 示例输出片段(final_df 头几行): ``` ...1 STATION NAME LATITUDE LONGITUDE ELEVATION statement 2020-01-01 2020-01-02 ... 1 1 101 Beijing 39.90 116.4 50.0 good 3.2 4.1 2 2 102 Tianjin 39.08 117.2 10.0 good 5.0 3.8 ... ``` --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值