
数据分析数据挖掘项目
文章平均质量分 95
第二人生2
这个作者很懒,什么都没留下…
展开
-
Python数据挖掘框架
@[TOC]…Python数据挖掘框架参考:https://zhuanlan.zhihu.com/p/258542655项目背景与分析以泰坦尼克号生存者问题为例。使用机器学习工具来预测哪些乘客可以幸免于悲剧。数据读入与检查导入与数据处理相关的库,并检查版本与数据文件夹导入与建模预测相关的库使用info()和sample()函数来快速概览变量数据类型数据预处理数据校正缺失值填充数据创建数据转换数据清洗数据划分探索性分析建模分析模型评估与优化交叉验证超参数调整特征选原创 2021-06-23 09:36:00 · 1651 阅读 · 2 评论 -
逻辑回归对信用卡欺诈进行分析
逻辑回归分类器 逻辑回归,也叫作 logistic 回归。虽然名字中带有“回归”,但它实际上是分类方法,主要解决的是二分类问题,当然它也可以解决多分类问题,只是二分类更常见一些。 在逻辑回归中使用了 Logistic 函数,也称为 Sigmoid 函数。Sigmoid 函数是在深度学习中经常用到的函数之一,函数公式为:函数的图形如下所示,类似 S 状: 你能看出 g(z) 的结果在 0-1 之间,当 z 越大的时候,g(z) 越大,当 z 趋近于无穷大的时候,g(z) 趋近于 1。同样当 z 趋近于原创 2020-11-15 11:14:21 · 1190 阅读 · 0 评论 -
信用卡违约率分析
信用卡违约率分析加载数据探索数据数据规范化数据集划分模型创建模型训练模型评估加载数据 这个数据集是台湾某银行 2005 年 4 月到 9 月的信用卡数据,数据集一共包括 25 个字段,具体含义如下:探索数据数据规范化数据集划分模型创建模型训练模型评估...原创 2020-11-14 16:07:15 · 1589 阅读 · 1 评论 -
网易云爬取歌词进行歌词词云可视化
词云工具WordCloud使用 pip install wordcloud安装工具后就可以创建词云,构造方法主要的构造参数如下:wc = WordCloud( background_color='white',# 设置背景颜色 mask=backgroud_Image,# 设置背景图片 font_path='./SimHei.ttf', # 设置字体,针对中文的情况需要设置中文字体,否则显示乱码 max_words=100, # 设置最大的字数 stopw原创 2020-11-13 16:04:08 · 1637 阅读 · 0 评论 -
SVM 美国威斯康星州乳腺癌检测
整体项目流程数据获取与查看数据字段数据探索数据清洗特征选择模型训练数据集和训练集的划分数据标准化操作模型训练与评估数据获取与查看数据字段 mean 代表平均值,se 代表标准差,worst 代表最大值(3 个最大值的平均值)。每张图像都计算了相应的特征,得出了这 30 个特征值(不包括 ID 字段和分类标识结果字段 diagnosis),实际上是 10 个特征值(radius、texture、perimeter、area、smoothness、compactness、concavity、concav原创 2020-11-11 10:31:27 · 3563 阅读 · 0 评论