贷款违约预测是现代金融机构信用风险管理的基础。金融机构审批贷款时会收集客户的个人信息,包括年龄、收入、学历、职业、家庭情况和借贷历史等,在对各项信息综合考虑的基础上决定是否审批贷款。为了避免贷款违约,金融机构在对借款人发放贷款的时候必须对借款人的信用程度进行评估打分,预测贷款违约的概率,并做出是否发放贷款的判断。
本案例利用逻辑回归模型预测贷款人是否会发生违约行为。通过贷款数据(包括个人信息、财务状况和贷款状态等)来训练模型,通过模型分析贷款人的偿还能力,预测贷款申请人是否会发生违约。
import pandas
import matplotlib.pyplot as plt
import seaborn
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
plt.rcParams['font.sans-serif']=['SimSun']
plt.rcParams['axes.unicode_minus']=False
def get_data(path):
bank_data = pandas.read_csv(path)
x = bank_data.iloc[0:700, :8]
y = bank_data.iloc[0:700, 8