python脚本下载ERA5数据详细规范和教程
ECMWF官网:
https://cds.climate.copernicus.eu/
API请求官方教程:
https://cds.climate.copernicus.eu/api-how-to
下载数据准备工作
注册官网账户,登录生成自己的UID和key
配置并安装CDS API
创建一个.cdsapirc文件 其实直接新建文本文档后再改也行,如下配置修改保存到C:\Users\用户下
安装cdsapi库
pip install cdsapi #根据自己本地环境安装即可
下载数据规范
1.存储路径规范
/path/{产品要素}/{年}/{月}/{日}
采用分要素下载数据文件
2.文件命名规范
ERA5-{year}{month}{day}_{type_str}.grib #type_str是数据的variable
数据格式统一采用grib或者nc格式
python下载脚本
logging.basicConfig(filename='download_log_ERA5.log',
level=logging.INFO,
format='%(asctime)s - %(levelname)s - %(message)s')
def create_folder_if_not_exists(path):
if not os.path.exists(path):
os.makedirs(path)
logging.info(f"创建文件夹: {path}")
else:
logging.info(f"文件夹已存在: {path}")
def is_valid_date(year, month, day):
try:
request_date = datetime(int(year), int(month), int(day))
current_date = datetime.now()
latest_era5_date = current_date - timedelta(days=5)
if request_date > latest_era5_date:
logging.error(f"请求日期{request_date}超过最新可用日期{latest_era5_date}")
return False
return True
except ValueError as e:
logging.error(f"无效日期: {year}-{month}-{day}, 错误: {e}")
return False
def down(year, month, day, level, variables, type_str, path, retries=3, delay=60):
if not is_valid_date(year, month, day):
return
month = f"{int(month):02d}"
day = f"{int(day):02d}"
dataset = "reanalysis-era5-pressure-levels"
request = {
'product_type': 'reanalysis',
'variable': variables,
'year': year,
'month': month,
'day': day,
'time': ['00:00', '01:00', '02:00', '03:00', '04:00', '05:00',
'06:00', '07:00', '08:00', '09:00', '10:00', '11:00',
'12:00', '13:00', '14:00', '15:00', '16:00', '17:00',
'18:00', '19:00', '20:00', '21:00', '22:00', '23:00'],
'pressure_level': level,
'area': [90, -180, -90, 180], # 全球
'format': 'grib'
}
client = cdsapi.Client()
date_str = f"{year}/{month}/{day}"
folder_path = os.path.join(path, date_str)
file_name = f"ERA5-{year}{month}{day}_{type_str}.grib"
file_path = os.path.join(folder_path, file_name)
for attempt in range(retries):
try:
create_folder_if_not_exists(folder_path)
logging.info(f"开始下载: {date_str} {type_str}")
client.retrieve(dataset, request, file_path)
logging.info(f"下载成功: {file_path}")
return
except Exception as e:
logging.error(f"下载失败: {e},尝试 {attempt + 1}/{retries}")
if attempt < retries - 1:
time.sleep(delay)
else:
logging.error(f"全部重试失败: {date_str}")
with open("part.json", encoding='utf-8') as f:
content = json.load(f)
for c in content:
year = c['year']
month = c['month']
day = c['day']
if not is_valid_date(year, month, day):
continue
for type_var in c['variableUPAR']:
base_path = "/ERA5/"
# 处理组合变量情况/风场数据
if type_var == 'uv_component_of_wind':
variables = ['u_component_of_wind', 'v_component_of_wind']
type_str = 'uv_component_of_wind'
else:
variables = [type_var]
type_str = type_var
down(year, month, day, c['level'], variables, type_str, base_path)
注意事项
下载时间维度、空间维度、时间维度、产品选择在脚本中可根据需求修改
下载完的样例
数据下载规范:
数据下载规范:[自定义规范,根据实际情况设计]
ERA5再分析资料,详情官网学习。
统一数据下载使用开发规范,数据下载必须规范文件名、数据结构、数据格式、数据存储
1.文件名规范:
【ERA5-日期-要素名.grib 】按照单要素、时间1天【00:00-23:00】下载单个文件数据
例:ERA5-yyyymmdd-2m_temperature.grib
2.数据结构规范:
数据结构遵循grib国际规范,variable存储要素、时间维度、空间维度都为二维格点数组【包含要素、时间、经度、维度、气压层】
3.数据格式规范:
统一使用grib或者nc格式【目前统一使用grib格式】
4.数据存储规范:
基础规范遵循:数据大类/数据小类/年/月/日/文件【根据数据情况实际调整】
例:era5\surf\2025\03\26\ERA5-yyyymmdd-2m_temperature.grib
5.数据下载验证:
数据下载后需要验证是否满足格式、结构要求,使用可视化工具查看验证。