
EDA
亦饮亦歌
.net coding, Project Manager, Product Manager,python
展开
-
泰坦尼克数据探索性数据分析(机器学习部分 待续)
参照Kaggle上的https://www.kaggle.com/pedrodematos/titanic-a-complete-approach-to-top-rankings 进行探索性数据分析学习基于Titanic Dataset进行自动化EDA, 不同数据的预处理和建模。主要目标是尝试提出一个完整的建模问题方法,从探索性数据分析到将监督和非监督学习技术应用于我们的数据。1、数据探索第一步是导入所需的库开始分析之前让我们先看看数据集。为了节省时间在我们的探索数据分析过程,我们将使用2个库:.原创 2020-10-27 11:39:24 · 768 阅读 · 0 评论 -
统计之均值中位数众数全距四分位数以及箱线图展示
均值:即平均数,数列中各数总和除以个数。可用numpy.mean函数计算中位数: 数字从小到大排列的数列中位于中间位置的那个数,如果数列个数为奇数位则中位数位于(n+1)/2, 如果为偶数位则为n/2与n/2+1的两个数的平均值,可以用numpy.median函数计算众数:数列中出现频率最多的数, 可以用scipy的stats.mode函数计算全距:数列中最大值与最小值的差四分位数:将从小到大排列的数列平均分为4段,最小的四分位数称为下四分位数,最大的成为上四分位数,中间的称为中位数可以用箱线图展原创 2020-10-16 11:54:03 · 5600 阅读 · 0 评论 -
淘宝数据探索性分析
TBdata_EDA_With_Plotly本文是参照Video Game Sales - EDA with Plotly对TB数据进行的探索性分析 原文:https://www.kaggle.com/amritachatterjee09/video-game-sales-eda-with-plotly数据为2020年9月25日收集的维生素商品根据销量倒序排列前440条数据, 数据文件参照tb_vitamin_20200925.csv1、数据描述nid:商品ID title:商品名称及简要宣传性描原创 2020-10-13 11:24:35 · 557 阅读 · 1 评论