【机器学习】分类算法实现及应用

Ex1 使用决策树分类方法对鸢尾花数据集进行分类。

Ex2 使用逻辑回归模型对鸢尾花数据集进行分类。

Ex3分别使用准确率(accuracy)、ROC曲线、AUC作为评价指标对比Ex1和Ex2实验结果。

Ex4 实现Kaggle电信用户流失分类

    1)样本数据分析

该实例数据同样来自Kaggle,它的每一条数据为一个用户的信息,共有21个有效字段,其中,最后一个字段Churn标志该用户是否流失。运用numpy和pandas等工具对数据进行初步分析,尽量理解特征之间的关系。

  1. 分析实验要求
  2. 分析实验数据的完整性、重复性
  3. 分析实验数据各特征之间的关联关系

    2)用户画像

    运用各类分析工具对流失用户和非流失用户进行特征分析,说明流失用户和非流失用户的特点。

  4. 分析各特征与用户是否流失的关系
  5. 综合上述关系,给出流失用户和非流失用户的特点

     3)分类算法建模及分析

    运用各类分类算法对数据进行建模,包括:逻辑回归模型、决策树模型、随机森林模型。并用准确率和AUC指标对它们的预测效果进行评估。

  6. 编码、特征提取
  7. 数据预处理
  8. 学习分类算法的应用方法
  9. 对样本数据进行建模
  10. 用准确度指标和AUC指标评估模型
  11. 记录并分析实验结果
  12. Ex1源代码:
    import pandas as pd
    from sklearn.datasets import load_iris
    iris = load_iris()
    iris_df = pd.DataFrame(iris.data, index = iris.target, columns = iris.feature_names)
    from sklearn.model_selection import train_test_split
    X_train, X_test, y_train, y_test = train_test_split(iris_df, iris.target, train_size = 0.55)
    #使
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值