近期的日志分析任务对分析的次数有了要求,从一天一次向几分钟一次靠拢,显然这不是hive该做的事。但鉴于领导要求先用hive来处理这样的需求,那就硬着头皮先弄出来再说。主要的思路就是每次分析语句执行之前,先查一次关系数据库存放结果的表,得到上一次分析结果的最大时间,然后此次的分析只获取那个时间点之后的数据。
此文考虑的是针对第一次执行的时候,数据库中没有信息,得到的最大时间值是NULL。一开始就想着怎么判断得到的值是否为空,使用if [ ! $var ]; then A else B fi句法,语句每次都到else那里执行,不管数据库是不是空的。在这里转了半天,突然明白了,我那个变量值并不是代表空的那个NULL,而是一个字符串值NULL。于是改为if [ "$var" = "NULL" ],逻辑判断通过。
附录网上找到的条件判断shell语法:
1、字符串判断
str1 = str2 当两个串有相同内容、长度时为真
str1 != str2 当串str1和str2不等时为真
-n str1 当串的长度大于0时为真(串非空)
-z str1 当串的长度为0时为真(空串)
str1 当串str1为非空时为真
2、数字的判断
int1 -eq int2 两数相等为真
int1 -ne int2 两数不等为真
int1 -gt int2 int1大于int2为真
int1 -ge int2 int1大于等于int2为真
int1 -lt int2 int1小于int2为真
int1 -le int2 int1小于等于int2为真
3 文件的判断
-r file 用户可读为真
-w file 用户可写为真
-x file 用户可执行为真
-f file 文件为正规文件为真
-d file 文件为目录为真
-c file 文件为字符特殊文件为真
-b file 文件为块特殊文件为真
-s file 文件大小非0时为真
-t file 当文件描述符(默认为1)指定的设备为终端时为真
3、复杂逻辑判断
-a 与
-o 或
! 非