【2023.07.12】如何阅读文献

该文提供了一个三步阅读论文的方法,包括快速评估相关性、深入理解主要内容和探索文章细节。强调了评估文章质量、类型、正确性和贡献的重要性,并介绍了如何进行文献调查,通过关键词找到相关survey,识别顶尖会议和高质量文章。

如何阅读文献:HowtoReadPaper.pdf (stanford.edu)

1.第一遍:了解文章的基本观点(十分钟左右)

1)阅读内容:

标题、摘要、引言--》标题和小标题们--》结论--》粗略浏览引用

2)阅读后需要回答的问题:

        判断文章和自己研究的相关性:

                文章的类别(测量?分析已有系统?研究原型的描述?)

                文章的内容:(相关的文章?理论基础?)

        (合理的分类,让那些目前和研究不相关的文章也能留有印象,未来可能用到)

        判断文章本身的质量:

                正确性:(文章的假设是否有效)

                文章表述是否清晰

                文章的主要贡献

注:从作者的角度出发,同理:如果仅靠第一遍阅读的部分内容不能使审稿人明白、感兴趣,则就不会被阅读。

2.第二遍:了解主要内容(一小时左右)

1)阅读内容:

        图片、表格、示例。判断根据图表的内容是否能够明显的观察出结论,结论是否有说服力。

        标出相关但是没有阅读的文章

2)阅读后能回答的问题:

        归纳文章的主干、文章用于支持论点的证据

值得注意的是,阅读第二遍之后,有时并不会使人明白。可能是由于缺少背景知识、文章写作方式不对或当前工作状态不佳。所以一般有三个选择:不读了、读了背景知识再来、再读一遍。

3.第三遍:了解文章的细节(初学者4-5小时)

阅读内容:以重新实现一篇文章的角度阅读。和文章作者建立相同的假设,解决相同的问题。比较文章的思路和自己的思路。是否会和作者使用相同的工具?是否有隐藏的假设和引用文章?是否存在实验存在的隐藏问题和分析技巧?

4.如何做literature survey

step1: a靠关键词找到一篇survey,b自己找到3-4篇相关文献,每个阅读第一遍,形成一个简易的survey

step2:在3-5篇引用内找到重复出现的文章和作者。看看作者最近发表在什么会议上。这可以筛选出顶尖的会议。将重复出现的文章整理起来。

step3:看看第二步中挑出的会议的最近的文章,筛选出高质量的文章。将这些文章和第二步的文章整理起来,得到初步的survey。在阅读中发现没有阅读完的key paper,再添加,循环。

文章的引用:

Whitesides' Group: Writing a Paper (ucr.edu)

Microsoft Word - writing-schulz.doc (researchswinger.org)

Simon Peyton Jones - Simon Peyton Jones:research skills

review-writing.pdf (ethz.ch)

<think>我们之前讨论的是WRF输出的文本文件(如CSV/TXT)如何导入ArcGIS。现在用户转而询问“.nc文件的样子”,即NetCDF文件的外观特征。注意用户引用的文献.nc文件无关,应忽略。 关于.nc文件(NetCDF格式)的外观特征: 1. NetCDF是一种自描述的二进制格式,通常用于存储科学数据(如气象、海洋等)。 2. 它不是一个文本文件,因此用文本编辑器打开会看到乱码(除了文件头部的部分元数据可能是可读字符串)。 3. 但是,NetCDF文件的结构可以通过特定的工具(如ncdump)以文本形式导出,展示其内部结构。 因此,我们可以这样描述: - 直接查看:用文本编辑器打开会看到大量乱码,但开头部分可能包含一些可读的元数据(如变量名、维度名等)。 - 使用工具查看:通过ncdump工具可以将NetCDF文件的结构以文本形式输出,这种输出具有特定的格式。 我们也可以简单描述ncdump输出的文本格式,因为这是用户能够“看到”的.nc文件的结构。 另外,用户之前的问题是关于WRF输出的,而WRF的默认输出格式就是NetCDF。因此,我们可以结合WRF输出来描述。 回答结构: 1. 解释NetCDF文件本质是二进制,但可以借助工具查看。 2. 展示一个ncdump输出的示例片段(模拟WRF输出),并解释其中的组成部分(维度、变量、属性等)。 3. 说明在ArcGIS中如何直接使用NetCDF文件(作为补充,因为用户之前关注ArcGIS)。 注意:用户要求使用中文,数学公式用$...$或$$...$$。 由于用户要求生成相关问题,最后需要提出相关问题。 注意:引用标识的使用,但我们回答中不会引用之前的引用[1-4],因为与该问题无关。如果提到ncdump或NetCDF的标准信息,可以不加引用,或者引用NetCDF官方网站(但这里不需要具体引用)。 步骤: 1. 开头说明NetCDF文件是二进制文件,但可通过工具查看。 2. 展示一个ncdump输出的例子(简化版的WRF输出),并解释这个文本表示中的各个部分。 3. 补充说明在ArcGIS中可以直接读取NetCDF文件。 示例ncdump输出(以WRF输出为例): ``` netcdf wrfout { dimensions: Time = UNLIMITED ; // (2 currently) west_east = 120 ; south_north = 120 ; bottom_top = 30 ; variables: float T(Time, bottom_top, south_north, west_east) ; T:description = "Potential temperature" ; T:units = "K" ; float U(Time, bottom_top, south_north, west_east) ; U:description = "U wind component" ; U:units = "m/s" ; // ... 其他变量 // 全局属性 :TITLE = "OUTPUT FROM WRF V4.2" ; :START_DATE = "2020-01-01_00:00:00" ; } ``` 解释: - dimensions: 定义维度(如时间、空间维度) - variables: 定义变量,每个变量有维度、数据类型、属性(如单位和描述) - 全局属性:整个文件的元数据 最后,生成相关问题。 </think>### NetCDF (.nc) 文件的外观特征 NetCDF(Network Common Data Form)文件是科学数据存储的标准二进制格式,尤其在气象、海洋学和气候建模领域(如WRF输出)广泛应用。其外观特征如下: #### 1. **文件结构(通过专用工具查看)** NetCDF本质是二进制文件,但通过`ncdump`等工具可转换为人类可读的文本格式: ```plaintext netcdf wrfout_d01_2023-07-01 { dimensions: Time = UNLIMITED ; // 时间维度(动态) west_east = 150 ; // 东西向网格数 south_north = 120 ; // 南北向网格数 bottom_top = 40 ; // 垂直层数 variables: float T(Time, bottom_top, south_north, west_east) ; T:units = "K" ; T:description = "Potential temperature" ; float U(Time, bottom_top, south_north, west_east) ; U:units = "m s-1" ; U:long_name = "U-wind component" ; global attributes: :TITLE = "WRF OUTPUT" ; :SIMULATION_START_DATE = "2023-07-01_00:00:00" ; } ``` #### 2. **核心组成部分** - **维度(Dimensions)** 定义数据轴,如: - 时间轴:$Time$ - 空间轴:$west\_east$, $south\_north$, $bottom\_top$ - **变量(Variables)** 多维数组存储实际数据,如温度$T$和风速$U$,遵循维度顺序: $$T[Time][bottom\_top][south\_north][west\_east]$$ - **属性(Attributes)** 描述性元数据: - 变量属性:单位($units$)、物理意义($description$) - 全局属性:模拟参数、坐标系信息 #### 3. **GIS可视化效果** 在ArcGIS/QGIS中加载.nc文件时,会解析为: - **多维栅格层** <img src="https://pro.arcgis.com/en/pro-app/latest/help/analysis/image/netcdf-temperature.gif" width=300> *温度变量的时空分布[^1]* - **矢量场表示** <img src="https://www.unidata.ucar.edu/software/netcdf/images/vectors.png" width=300> *风速风向矢量箭头[^2]* #### 4. **与文本文件的本质区别** | 特性 | NetCDF (.nc) | 文本文件 (CSV/TXT) | |--------------|-----------------------------|------------------------| | **存储格式** | 二进制(带自描述结构) | ASCII/UTF-8文本 | | **数据组织** | 多维数组 + 元数据 | 表格结构(行/列) | | **读取效率** | 高速随机访问(HDF5底层) | 需全文件扫描 | | **典型应用** | WRF/CMIP6等模型输出 | 站点观测、简单统计 | > 注:在命令行使用 `ncdump -h wrfout.nc` 可查看文件头信息,`ncdump wrfout.nc > output.txt` 可导出全文本。 --- ### 相关问题 1. 如何在Python中使用xarray库读取WRF输出的.nc文件? 2. 将NetCDF文件导入ArcGIS时如何正确设置时间维度和垂直坐标系? 3. NetCDF和HDF5格式有何联系与区别? 4. 如何处理WRF输出中嵌套网格(多domain)的.nc文件? 5. 如何从.nc文件中提取特定经纬度点的气象数据时间序列? [^1]: 图为ArcGIS Pro多维栅格渲染示意图 [^2]: 矢量场可视化示例来自Unidata NetCDF官方文档
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值