3、保险理赔严重程度分析与预测

最新推荐文章于 2025-11-04 15:26:40 发布

z2a3b4c5d

最新推荐文章于 2025-11-04 15:26:40 发布

阅读量12

点赞数

CC 4.0 BY-SA版权

分类专栏： Scala机器学习实战精讲文章标签：保险理赔 GBT 随机森林

本文链接：https://blog.youkuaiyun.com/z2a3b4c5d/article/details/155045287

Scala机器学习实战精讲专栏收录该内容

20 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

保险理赔严重程度分析与预测

1. 测试集预测

在完成模型训练后，需要对测试集进行预测。以下是实现该功能的代码：

println("Run prediction on the test set")
cvModel.transform(Preproessing.testData)
      .select("id", "prediction")
      .withColumnRenamed("prediction", "loss")
      .coalesce(1) // to get all the predictions in a single csv file
      .write.format("com.databricks.spark.csv")
      .option("header", "true")
      .save("output/result_LR.csv")

上述代码会生成一个名为 result_LR.csv 的 CSV 文件，打开该文件可以看到每个 ID 对应的损失（理赔）情况。最后，建议调用 spark.stop() 方法停止 Spark 会话。