CSV.jl使用方法

CSV.jl是Julia中用于处理CSV文件的库,它支持自动类型检测和空值处理。你可以自定义分隔符、处理无标题行、指定数据起始行及读取数据片段。例如,使用`CSV.File(data.txt)`可默认读取CSV文件,通过`delim`参数设置自定义分隔符,`header=false`可忽略标题行,`skipto`和`limit`则用于指定数据范围。该库是数据预处理的重要工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CVS.jl简介

CSV.jl 一个快速灵活的纯 Julia 库,用于处理带分隔符的文本文件。

在建立模型与模型计算的过程中,可以很好的解决数据导入问题,它能自动辨识文本数据类型,并将数据分隔

它的应用场景是:使用数据之前的输入导入。

CSV.jl使用

基本实现

文件内容:

col1,col2,col3,col4,col5,col6,col7,col8
,1,1.0,1,one,2019-01-01,2019-01-01T00:00:00,true
,2,2.0,2,two,2019-01-02,2019-01-02T00:00:00,false
,3,3.0,3.14,three,2019-01-03,2019-01-03T00:00:00,true

使用以下代码导入文件

CSV.File("data.txt") #file为文件名,如"data.csv"、"data.txt"

默认情况下,CSV.File会自动检测这个文件的分隔符’,’,以及每列的类型。默认情况下,它将“空字段”视为missing(本示例中的整个第一列)。它还自动处理提升类型,例如第 4 列,其中前两个值为Int,但第 3 行具有Float64值 ( 3.14)。

自定义分隔符

文件内容:

col1::col2
1::2
3::4

使用以下代码导入文件

CSV.File("data.txt"; delim="::")

无标题情况

文件内容:

1,2,3
4,5,6
7,8,9

在没有标题的情况下,会默认把第一行当作标题,可以给定参数取消,使用以下代码导入文件

CSV.File("data.txt"; header=false) #取消标题

或者也可以手动给定标题

CSV.File("data.txt"; header=["col1", "col2", "col3"]) #手动给定标题

指定数据行数

文件内容:

col1,col2,col3
metadata1,metadata2,metadata3
extra1,extra2,extra3
1,2,3
4,5,6
7,8,9

假如我们期望的内容是从第四行开始,可以使用以下代码

CSV.File("data.txt"; skipto=4) #从第四行开始

或者

CSV.File("data.txt"; datarow=4)

读取数据段

文件内容:

col1,col2,col3
1,2,3
4,5,6
7,8,9
10,11,12
13,14,15
16,17,18
19,20,21

只需要读入某一段数据段

CSV.File("data.txt"; skipto=4,limit=1) #从第四行开始,读取1行

或者

CSV.File("data.txt"; skipto=4,footerskip=1) #从第四行开始,除去最后一行

转置

文件内容:

col1,1,2,3
col2,4,5,6
col3,7,8,9

用如下代码导入

CSV.File("data.txt"; transpose=true) #从第四行开始,读取1行

未完

那么,数据导入之后怎么调用或者处理呢?
见我的下一篇

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值