【数据处理】深入解析CMIP6数据与NetCDF（NC）文件：从入门到精通玩转NC文件！

最新推荐文章于 2025-10-30 20:49:11 发布

原创最新推荐文章于 2025-10-30 20:49:11 发布 · 1.5k 阅读

23 ·

CC 4.0 BY-SA版权

文章标签：

#python

Python 同时被 2 个专栏收录

17 篇文章

订阅专栏

数据处理

5 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

深入解析CMIP6数据

写在前面—为什么要写这篇博客？

小编最近在做一个气候项目，然后需要用到CMIP6数据，这个数据集里全是.nc文件，作为一个程序猿，小编也是第一次遇到这种文件，本着用什么学什么的原则，既然我们用到了，那就简单学习总结一下吧，如有不对的地方，还请各位读者指出！

CMIP6网址

一、CMIP6数据：全球气候模拟的核心资源

（一）CMIP6简介

第六次国际耦合模式比较计划（Coupled Model Intercomparison Project Phase 6, CMIP6）是当前全球气候研究的重要数据来源。它整合了全球多个气候模式的模拟结果，覆盖历史时期（如1850年至今）和未来情景（至2100年），旨在支持气候变化评估、极端事件预测及政策制定。可以评估气候模式性能、量化气候变化不确定性、探索不同排放情景下的气候响应。

（二） CMIP6数据特点

时空分辨率：部分数据集通过降尺度技术提升至0.25°（约25公里），如中国区域的逐日降水、温度数据。
变量多样性：涵盖降水、温度、风速、热应激指标（如湿球温度）、碳循环（植被/土壤碳储量）等。
偏差校正：通过统计方法（如等距离累积分布函数法）或动力降尺度，减少模式系统误差，提升数据可信度。

（三）典型应用案例

极端气候评估：基于CMIP6的高分辨率热应激数据集，预测未来劳动生产力损失及经济影响。
生态碳汇研究：分析中国植被与土壤碳储量变化，揭示造林对碳中和的贡献。
海洋气候模拟：揭示热带南太平洋次表层温盐误差的成因，改进模式性能。

二、NetCDF（NC）文件：气候数据的标准载体

（一）什么是NetCDF文件？

关于NetCDF文件的可以参考【数据处理】NetCDF 文件：从入门到精通
NetCDF（Network Common Data Form）是一种面向科学数据的自描述、跨平台文件格式，广泛应用于气候、海洋和地球科学领域。其核心优势包括：

多维结构：支持时间、纬度、经度、高度等多维度数据存储。
高效压缩：通过“分块存储”和压缩算法减少文件体积。
元数据丰富：内置变量属性（如单位、描述）、全局属性（如数据来源）。

（二）NC文件的结构解析

以CMIP6的降水数据为例，一个NC文件可能包含以下要素：

维度（Dimensions）：如time（时间）、lat（纬度）、lon（经度）。
变量（Variables）：如PREC（降水量，单位：mm/day）、TMAX（最高温度，单位：℃）。
属性（Attributes）：描述数据来源（如“CMIP6-CanESM5模式”）、处理方式（如“BC代表偏差校正”）。

（三）处理NC文件的常用工具

编程语言库：
- Python：xarray（简化多维数据操作）、netCDF4（基础读写）。
- R语言：ncdf4包支持数据提取与统计。
可视化软件：Panoply（图形化查看与导出CSV/图片）。
命令行工具：CDO（批量插值、裁剪区域）、NCO（数据拼接与统计）。

三、实战示例：从CMIP6 NC文件中提取区域数据

（一）目标：提取中国东三省2015-2100年的平均温度数据。

（二）步骤：

数据读取：使用Python的xarray库加载NC文件，筛选时间范围与区域经纬度（如东三省：纬度29°–31°，经度91°–98°）。
空间裁剪：通过.sel()方法截取目标区域，计算逐月或逐年均值。
导出结果：转换为DataFrame并保存为CSV或Excel文件。

代码片段（Python）：

import xarray as xr

# 加载NC文件
ds = xr.open_dataset('CMIP6_China_SSP245.nc')
# 提取区域数据
ds_region = ds.sel(lat=slice(29, 31), lon=slice(91, 98))
# 计算年均温度
annual_mean = ds_region['TEMP'].groupby('time.year').mean()
# 导出为CSV
annual_mean.to_dataframe().to_csv('dongbei_temp.csv')