UFO 数据处理与分析
1. 数据预处理
在处理 UFO 数据时,首先要对日期和位置数据进行预处理。
1.1 日期数据处理
对于日期数据,我们需要检查其长度是否为 8 位,如果不是则返回 FALSE 。然后找出数据框中格式错误的条目数量,若数量较少(如 371 行,而总数据超过 60000 行),可直接删除这些条目。接着将日期数据转换为 Date 类型,示例代码如下:
ufo$DateOccurred<-as.Date(ufo$DateOccurred, format="%Y%m%d")
ufo$DateReported<-as.Date(ufo$DateReported, format="%Y%m%d")
1.2 位置数据处理
UFO 在美国的目击记录位置数据通常为 “城市, 州” 的格式。我们可以使用 R 的正则表达式将这些字符串拆分为单独的列,并识别不符合该格式的条目。
以下是处理位置数据的具体步骤:
1. 定义一个函数 get.location 来处理位置字符串:
get.location<-function(l) {
split.location<-tryCatch(strsplit(l,",")[[1]], error= function(e) return(c(NA, NA)))
clean.location&
超级会员免费看
订阅专栏 解锁全文
67

被折叠的 条评论
为什么被折叠?



