探索性数据分析与建模:从数据清理到神经网络应用
在数据科学领域,数据清理、分析和建模是一系列关键步骤,能帮助我们从原始数据中提取有价值的信息。本文将详细介绍如何对采购申请数据进行处理,包括数据类型调整、缺失值处理、数据探索、特征分析以及使用 TensorFlow 和 Keras 构建神经网络模型。
数据清理
在处理数据时,首先要确保数据类型的正确性。对于数值或整数列,应避免将其存储为字符类型。以下是具体操作步骤:
1. 调整数据类型 :
pr$deletion <- as.integer(pr$deletion)
pr$Qty.Requested <- as.numeric(pr$Qty.Requested)
pr$Valn.Price <- as.numeric(pr$Valn.Price)
pr$Net.Price <- as.numeric(pr$Net.Price)
- 处理缺失值 :将数值列中的 NA 值替换为 0。
pr[,c("Qty.Requested", "Valn.Price", "Net.Price")] <-
apply(pr[,c("Qty.Requested", "Valn.Price", "Net.Price")], 2,
function(x){replace(x, is.na(x), 0)})
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



