文章目录
hadoop文件路径正则写法:
*
:匹配0或多个字符?
:匹配一个字符- 原子表:
[abcd]
:匹配{a,b,c,d}中的一个字符[^abcd]
:匹配不是{a,b,c,d}中的一个字符[a-d]
:匹配{a,b,c,d}中的一个字符[^a-b]
匹配不是{a,b,c,d}中的一个字符
{aaa,bbb}
或选择,匹配包含aaa或bbb中的一个的语句 非正则表达式语法- 不支持或匹配:
[com|cn]
❌
因此,可以一次读取多个文件。比如:一次性读取2024.1.1日至2024.6.30日的数据
afs://cnw-xa-main.xxxx.com:9902/xxxxx/baiduapp_siyu_2/{202401*,202402*,202403*,202404*,202405*,202406*}
# 可优化为
afs://cnw-xa-main.xxxx.com:9902/xxxxx/baiduapp_siyu_2/20240[1-6]*