第二周周报
数据分析
在建立模型,对数据进行训练分析之前,需要对数据的整体,有一个大概的了解,了解数据的种类,范围,缺失情况等信息,我在上一周对数据的总体情况进行了分析,以下是其中的一部分。
- 数据大小

- 数据总览

- 数据缺失

实战结果
在翻阅资料的过程中,我看到一个思路,就是利用数据中的贷款等级进行预测,这个思路比较的简洁明了,因此上一周我的实践就是根据这一方面进行的。
首先,我们假定,原数据所给的信用评级,一定是有其道理的,因此,我们可以利用这个评级,通过对训练集中每个评级的违约率进行统计,即可以作为我们预测的结果,通过这种思路,可以快速地得出一个初步的结果。
成绩如下:
