logistic结果各个维度可视化 py更新为什么pyc没更新 2016.05.23回顾

1、加上了lptrigger,但是生产环境似乎还需要继续调试, 难道需要重启?还是py更新了,pyc没有跟着更新?
2、下午又开始玩echarts,想进一步完善可视化,开始的想法是在雷达图上,但是经过几个小时的探索,我发现并不能把每个维度的得分(woe或者其他可表征该维得分的值)画成雷达图,感觉雷达图的维度权重是相同的,尺度范围也是相同,这种比较好画雷达图,逻辑斯蒂画标准雷达图似乎不太可能,我没找到一个可行的方法,比如学历维度低、收入来源维度低,但是可能还是approve,而这种与逾期维度低,借贷情况低面积是相同,而这种有可能是decline,因为每个维权重不一样,而且雷达图很难看出这个维是好还是不好,雷达图是两两比较出来的,反观woe非常直观,正负就表征了好与坏,所以我最后想到的方法是正负直方图每个维度一目了然,多维度就是线性加合,在这个过程中,我又对logistic有了更进一步的认识,比如他的常数项,是一种修正,θX都是对结果的贡献,呈单增或单减(根据算0还是算1的概率)
3、然后我发现坏账这个字段以前同事存在统计不全的情况,我准备按照她的逻辑来改一下,顺便搞清楚她的逻辑
以上,昨天已经开始了锻炼和11点半作息,非常好,继续发扬,带堂客锻炼同时也是对自己的一种督促,效果不错!加油!

# 题目重述 使用 `scikit-learn` 中的 `LogisticRegression` 对鸢尾花数据集(Iris)进行分类,并将分类结果可视化。 # 详解 ```python # 导入所需库 from sklearn.datasets import load_iris from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score import matplotlib.pyplot as plt import seaborn as sns import pandas as pd # 加载鸢尾花数据集 iris = load_iris() X = iris.data # 特征 (150, 4) y = iris.target # 标签 (150,) # 仅使用前两个特征进行可视化(便于二维绘图) X_2d = X[:, :2] # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X_2d, y, test_size=0.3, random_state=42) # 创建逻辑回归模型 model = LogisticRegression(max_iter=200) model.fit(X_train, y_train) # 预测测试集 y_pred = model.predict(X_test) # 计算准确率 acc = accuracy_score(y_test, y_pred) print(f"分类准确率: {acc:.3f}") # 可视化分类结果 plt.figure(figsize=(8, 6)) # 定义类别名称和颜色 class_names = iris.target_names colors = ['red', 'blue', 'green'] # 绘制真实标签的散点图 for i, class_name in enumerate(class_names): plt.scatter( X_test[y_test == i, 0], X_test[y_test == i, 1], c=colors[i], label=f'{class_name} (真实)', alpha=0.7, edgecolor='k' ) # 绘制预测标签的边界或整体趋势(可通过网格预测画决策边界) xx, yy = np.meshgrid( np.linspace(X_2d[:, 0].min() - 0.5, X_2d[:, 0].max() + 0.5, 100), np.linspace(X_2d[:, 1].min() - 0.5, X_2d[:, 1].max() + 0.5, 100) ) grid = np.c_[xx.ravel(), yy.ravel()] Z = model.predict(grid).reshape(xx.shape) # 添加决策边界背景 plt.contourf(xx, yy, Z, alpha=0.3, colors=colors) # 图像设置 plt.title(f'鸢尾花分类结果(准确率: {acc:.3f})') plt.xlabel('萼片长度 (cm)') plt.ylabel('萼片宽度 (cm)') plt.legend() plt.grid(True) plt.tight_layout() plt.show() ``` > 注意:若未导入 `numpy`,需补充 `import numpy as np`。 该代码使用前两个特征(萼片长度和宽度)训练逻辑回归模型,绘制了测试样本的真实类别,并叠加了由模型决定的**决策边界**,从而直观展示分类性能。 # 知识点 - **逻辑回归分类原理**:虽含“回归”,实为分类算法,适用于多类标签判别。 - **决策边界可视化**:通过网格预测生成区域色块,展现模型划分规则。 - **Scikit-learn 建模流程**:包括数据加载、训练、预测与评估的标准步骤。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值