
数据可视化
文章平均质量分 70
介绍数据可视化的各类图形,详述图形的解释和基于Python的代码实现,持续更新中……
data learning
数据挖掘爱好者
展开
-
数据可视化之竖直条形图(原理+Python代码)
数据来源于天池赛题:零基础入门数据分析-学术前沿趋势分析地址:https://tianchi.aliyun.com/competition/entrance/531866/information一、原理介绍条形图是一种常见的基本统计图形,用于展示分类变量各个类别的数量。条形图又可以分为竖直条形图、水平条形图、堆叠条形图等。其中,竖直条形图是一种将条形竖着放置的条形图,通过比较不同类别条形的长短,可以直观地看出各类别数量上的差异。这里通过绘制竖直条形图,来对计算机领域发表论文对应的代码类别的数量进行统原创 2021-01-19 17:07:01 · 1713 阅读 · 1 评论 -
数据可视化之水平条形图(原理+Python代码)
数据来源于天池赛题:零基础入门数据分析-学术前沿趋势分析 ,地址:https://tianchi.aliyun.com/competition/entrance/531866/information目录一、原理介绍二、代码实现三、结果解释一、原理介绍条形图是一种常见的基本统计图形,用于展示分类变量各个类别的数量。条形图又可以分为竖直条形图、水平条形图、堆叠条形图等。其中,水平条形图是一种将条形横向放置的条形图,通过比较不同类别条形的长短,可以直观地看出各类别数量上的差异。这里通过绘制水平条形图,来展原创 2021-01-16 12:12:52 · 2401 阅读 · 0 评论 -
数据可视化之饼状图(原理+Python代码)
数据来源于Kaggle数据集,链接:https://www.kaggle.com/Cornell-University/arxiv目录一、原理介绍二、代码实现三、结果解释一、原理介绍饼状图是数据可视化中的一种基本图形,常用于展示某一分类变量中各个类别所占的比例。根据饼状图中各个扇形所占的角度大小,可以比较得出数量多的类别和数量少的类别。此外,分类变量可视化的图形还有树形图、玫瑰图、雷达图等。这里通过绘制扇形图,来比较计算机各个方向发表论文数量的差异。二、代码实现#加载常用模块import pa原创 2021-01-13 16:08:33 · 5474 阅读 · 0 评论 -
数据可视化之热力图&相关系数图(原理+Python代码)
目录一、原理介绍二、代码实现三、结果解释一、原理介绍热力图,又名相关系数图。根据热力图中不同方块颜色对应的相关系数的大小,可以判断出变量之间相关性的大小。两个变量之间相关系数的计算公式为:ρX1X2=Cov(X1,X2)DX1,DX2=EX1X2−EX1∗EX2DX1∗DX2\rho _{_{X_{1}X_{2}}}=\frac{Cov(X_{1},X_{2})}{\sqrt{DX_{1},DX_{2} }}=\frac{EX_{1}X_{2}-EX_{1}\ast EX_{2}}{\sqrt{DX_原创 2021-01-12 22:46:07 · 132297 阅读 · 20 评论 -
数据可视化之树形图(原理+Python代码)
目录一、原理介绍二、代码实现三、结果解释一、原理介绍树形图常用于对分类变量进行可视化分析,树形图的面积代表了所对应类别的数量,常用于比较各类别在数量上的差异。二、代码实现数据来源于上市企业数据,通过绘制树形图,来比较不同行业的企业数量分布差异。import squarify from pyforest import *import warningswarnings.filterwarnings('ignore')import numpy as npimport pandas as pd原创 2021-01-07 21:59:59 · 7206 阅读 · 1 评论 -
数据可视化之堆叠面积图(原理+Python代码)
目录一、原理介绍二、代码实现三、结果解释一、原理介绍面积图,又称区域图,可以看成是进行颜色填充后的折线图。这种图形不仅可以展示数据的波动和趋势,其围成的面积还可以直观地反映数据量的大小。面积图可分为两种,一般面积图和堆叠面积图。二者的差别如下:一般面积图:图中所有的数据都按照实际值绘制,即从相同的零轴开始。堆叠面积图:每一个变量的起点不同,依次在前一个变量的数值上进行叠加。图形的总面积表现为各个变量值的总量。通过比较不同颜色的面积块,可以得出不同的变量在数值上的差异,对应面积块越大的变量,其数值也原创 2021-01-07 21:31:09 · 9258 阅读 · 0 评论 -
数据可视化之折线图(原理+Python代码)
折线图是一种线形图,常用于展示数据的波动情况,与时间序列图类似。数据来源于某上市企业2000年至2017年的资产负债率(标准化后的),用来观察该企业在此期间的资产负债率的变化情况。下面是代码的实现过程:import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings("ignore") #过滤掉警告的意思data=pd.read_csv("F:原创 2021-01-06 21:58:57 · 2847 阅读 · 0 评论 -
数据可视化之小提琴图(原理+Python代码)
数据可视化之小提琴图(原理+代码Python)数据来源于天池赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX目录数据可视化之小提琴图(原理+代码Python)一、原理介绍二、...原创 2020-03-22 17:30:58 · 14787 阅读 · 5 评论