
数据分析与可视化
文章平均质量分 92
对数据进行绘图和可视化,主要绘图工具:seaborn(Python)、matplotlib(Python)、R、Origin
落痕的寒假
这个作者很懒,什么都没留下…
展开
-
[python] 基于PyWaffle库绘制华夫饼图
PyWaffle库通过其Waffle类提供了一种便捷的方式来创建华夫饼图。每个类别的方格占比可以通过参数values进行设置,数据可以是列表、字典和Pandas.DataFrame结构。然后可以使用rows和columns参数来定制行数和列数。只需要指定其中一个参数,另一个参数可以根据values的总和推断出来。# 新建绘图图像rows=5,# 保存结果plt.show()如果value参数输入的是比例值,则必须设置rows和columns属性来定义值的显示方式。rows=2,原创 2024-04-30 21:42:59 · 1163 阅读 · 2 评论 -
[数据分析与可视化] 基于Python绘制简单动图
动画是一种高效的可视化工具,能够提升用户的吸引力和视觉体验,有助于以富有意义的方式呈现数据可视化。本文的主要介绍在Python中两种简单制作动图的方法。其中一种方法是使用matplotlib的Animations模块绘制动图,另一种方法是基于Pillow生成GIF动图。原创 2023-10-24 13:40:42 · 3812 阅读 · 4 评论 -
[数据分析与可视化] Python绘制数据地图5-MovingPandas绘图实例
MovingPandas是一个基于Python和GeoPandas的开源地理时空数据处理库,用于处理移动物体的轨迹数据。,本文主要介绍三个MovingPandas的绘图实例。。。。MovingPandas作者推荐在Python 3.8及以上环境下安装MovingPandas,并建议使用conda进行安装。由于MovingPandas的依赖环境较为复杂,所以不推荐使用pip进行安装。下面的代码展示了MovingPandas的版本信息,本文所用Python版本为Python3.10。原创 2023-08-11 12:16:19 · 1649 阅读 · 0 评论 -
[数据分析与可视化] Python绘制数据地图4-MovingPandas入门指北
MovingPandas是一个基于Python和GeoPandas的开源地理时空数据处理库,用于处理移动物体的轨迹数据。它提供了一组强大的工具,可以轻松地加载、分析和可视化移动物体的轨迹。通过使用MovingPandas,用户可以轻松地处理和分析移动对象数据,并从中提取有关行为、模式和趋势的见解。无论是处理交通流量数据、物流轨迹数据还是动物迁徙数据,MovingPandas都是一个强大的地理可视化工具。。。。原创 2023-08-03 12:23:42 · 1709 阅读 · 0 评论 -
[数据分析与可视化] 基于matplotlib和plottable库绘制精美表格
plottable提供了ColumnDefinition类(别名ColDef)来自定义图形表格的单个列的样式。name: str,要设置绘图效果的列名title: str = None,用于覆盖列名的绘图标题width: float = 1,列的宽度,默认情况下各列的宽度为轴的宽度/列的总数textprops: Dict[str, Any] = field(default_factory=dict),提供给每个文本单元格的文本属性。原创 2023-07-10 17:58:54 · 4800 阅读 · 4 评论 -
[数据分析与可视化] 基于matplotlib-scalebar库绘制比例尺
matplotlib-scalebar是一个Python库,用于在matplotlib图形中添加比例尺。它允许用户指定比例尺的大小、位置、字体和颜色,以及比例尺的单位。该库支持不同的比例尺单位,例如米、英尺、英寸等。matplotlib-scalebar安装命令如下:pip install matplotlib-scalebar比例尺是一种用于描述图上线段长度与实际相应线段长度之间关系的方法。其基本公式为:比例尺 = 图上距离 / 实际距离。比例尺的表示方法可以分为三种:数字式,采用数字的比例形原创 2023-06-28 19:35:46 · 2848 阅读 · 3 评论 -
[数据分析与可视化] Python绘制数据地图3-GeoPandas使用要点
通过更改 ScaleBar 参数能够调整比例尺的显示效果,ScaleBar具体参数如下所示。这些参数的使用可以自行尝试。原创 2023-06-16 19:52:17 · 5177 阅读 · 0 评论 -
[数据分析与可视化] Python绘制数据地图2-GeoPandas地图可视化
如下代码所示,绘制江苏省地级市GDP地图。# 读取2019江苏省各市GDP数据 import geopandas as gpd import matplotlib . pyplot as plt import pandas as pdplt . rcParams [ "font.family" ] = 'FZSongYi-Z13S' # 数据来自互联网 gdp = pd . read_csv("2022江苏省各市GDP.csv") gdp排行地级市2022年GDP(亿元)01苏州市。原创 2023-04-09 10:42:19 · 6561 阅读 · 0 评论 -
[数据分析与可视化] Python绘制数据地图1-GeoPandas入门指北
地信、计算机和遥感等领域的从业人员或多或少都会接触地理信息系统(GIS,Geographic Information System)的相关知识。所谓GIS简单来说就是一个以计算机为核心,对地理空间位置相关数据进行创建、管理、分析、绘制和展示的多功能集成信息系统。绘制地图,则需要了解GIS中的坐标参考系。本文只是简单介绍坐标参考系的相关内容。相关内容总结于以下文章,想要具体了解更多内容也可以看看这些文章。聊聊GIS中的坐标系基于geopandas的空间数据分析——坐标参考系篇前后端都要懂一点的 GIS。原创 2023-03-16 20:05:22 · 3678 阅读 · 0 评论 -
[python] 基于wordcloud库绘制词云图
词云Wordcloud是文本数据的一种可视化表示方式。它通过设置不同的字体大小或颜色来表现每个术语的重要性。词云在社交媒体中被广泛使用,因为它能够让读者快速感知最突出的术语。然而,词云的输出结果没有统一的标准,也缺乏逻辑性。对于词频相差较大的词汇有较好的区分度,但对于颜色相近、频次相近的词汇来说效果并不好。因此词云不适合应用于科学绘图。本文基于python库wordcloud来绘制词云。wordcloud安装方式如下:wordcloud库关于绘制词云的相关函数均由其内置类WordCloud提供。WordCl原创 2022-12-07 11:51:40 · 7004 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点12-图表注释的重要性
数据绘图要点12-图表注释的重要性图表注释是数据可视化的关键组成部分。它可以将枯燥的图形变成一种有趣且富有洞察力的信息传达方式。我们目前在网上看东西的注意力平均不到五秒。因此,如果您无法在五秒钟内吸引某人的注意力,那么您可能已经失去了观众。添加准确的注释可以极大地帮助吸引观众的注意力。使用关键字、形状、颜色和其他视觉效果来帮助他们直奔主题。注释是一个通用概念,存在数百种不同的图表注释方法,具体使用取决于实际内容,让我们来看看几个例子。文章目录数据绘图要点12-图表注释的重要性示例 1示例2示例3参考示原创 2022-01-18 11:48:47 · 1417 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点11-雷达图的注意事项
数据绘图要点11-雷达图的注意事项准确通过雷达图表现数据有许多值得需要思考的地方,本文主要介绍雷达图的一些注意事项。文章目录数据绘图要点11-雷达图的注意事项雷达图绘制基础雷达图多类别雷达图雷达图存在的问题与解决方案雷达图存在的问题解决方案参考雷达图绘制基础雷达图雷达图又称蜘蛛图或网络图,是一种二维图表类型,设计用于绘制多个定量变量的一个或多个数值系列。每个变量都有自己的轴,所有轴都连接在图形的中心。让我们考虑一个学生的考试成绩。他在数学、体育、统计学等十个主题上的得分范围为 0 到 20。雷达图原创 2022-01-12 11:54:14 · 6141 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点10-图例的构建
数据绘图要点10-图例的构建图例是数据可视化中传达信息非常关键的部分,因此创建合适的图例非常重要。这篇文章描述了如何设置ggplot2图例中的标题、文本、位置、符号等。文章目录数据绘图要点10-图例的构建ggplot2图例设置ggplot2创建默认图例更改图例标题labs()图例信息的删除控制图例位置图例外观设置参考ggplot2图例设置ggplot2创建默认图例默认情况下,只要形状特征映射到ggplot调用的aes()部分中的变量,ggplot2就会自动在图表上生成图例。因此,如果您在ggplo原创 2022-01-06 11:51:55 · 1299 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点9-颜色的选择
数据绘图要点9-颜色的选择文章目录数据绘图要点9-颜色的选择颜色绘图要点准确选择图表类型如何做出更好的颜色选择绘图实例参考颜色是数据可视化中传达信息的主要媒介之一。它们允许我们适当突出显示组或变量,但颜色错误的选择可能会造成混淆或误导。本文主要介绍如何在绘图时选择合适的颜色。颜色绘图要点准确选择图表类型如下图所示,左图选择使用渐变色表现变量值的变化趋势,但是渐变色很难体现实际值之间的差异。因此推荐使用条形、位置(如在点图中)甚至区域来显示最重要的值,而颜色仅用于显示类别,如右图所示。此外如果图原创 2022-01-01 10:48:08 · 2198 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点8-环状条形图的使用
数据绘图要点8-环状条形图的使用环状条形图RADIAL BAR CHARTS是指用极坐标而不是笛卡尔平面绘制的条形图,RADIAL BAR CHARTS没有规定的中文翻译,有些人翻译为环状条形图,有些人翻译为径向条形图。绘图实例下图是显示2017年某一商品前6大国家的出口数量。# 导入库library(tidyverse)library(hrbrthemes)# 加载数据data <- read.table("https://raw.githubusercontent.com/hol原创 2021-12-29 11:46:41 · 1321 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点7-过度绘图
数据绘图要点7-过度绘图过度绘图是数据绘图中的一个常见问题。当您的数据集很大时,散点图的点往往会重叠,使图形不可读。在这篇文章中,将给出多种解决方法来避免过度绘图。文章目录数据绘图要点7-过度绘图过度绘图实例解决方法减少点的尺寸透明度2维密度图数据采样突出显示特定组分组分图三维图边缘分布参考过度绘图实例下面的散点图中说明了过度绘图存在的问题。乍一看可能会得出这样的结论:X 和 Y 之间没有明显的关系。但后续我们将证明这个结论是多么错误。# # 加载库library(tidyverse)libr原创 2021-12-25 11:14:31 · 992 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点6-数据组过多
数据绘图要点6-数据组过多比较几个数值变量的分布是数据展示中的一项常见任务。变量的分布可以使用直方图或密度图来表示,在同一轴上表示适量数据的组是非常有吸引力的。但是数据组过多将严重影响图表信息表现。数据分布绘图实例下面是一个示例,展示了人们如何感知词汇。短语“Highly likely”表示什么情况的概率问题。以下是人们给出概率分数分布结果。# 加载库library(tidyverse)library(hrbrthemes)library(viridis)library(patchwork)原创 2021-12-19 12:02:03 · 1328 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点5-误差线的问题
数据绘图要点5-误差线的问题文章目录数据绘图要点5-误差线的问题误差线的绘制误差线中的问题误差线隐藏信息误差线的计算方式解决方法参考误差线给出了测量精确度的一般概念,真实(无误差)值可能与报告值相差多远。如果条形图上显示的值是聚合的结果(如多个数据点的平均值),您可能需要显示误差线。但我们必须要谨慎使用误差线,具体原因将在后续给出。误差线的绘制在下图中,报告了5个group。条形高度代表它们的平均值。黑色误差线提供有关单个观测值如何分散在平均值周围的信息。例如,似乎groupB中的测量结果比grou原创 2021-12-09 11:59:44 · 6391 阅读 · 0 评论 -
[数据与分析可视化] D3入门教程3-d3中的数据操作
d3.js入门教程3-d3.js中的数据操作d3.js是一个用于绘图的JavaScript库。 它可以可视化展示任何类型的数据。 这篇文章介绍d3.js最常见的数据操作任务,包括排序、过滤、分组、嵌套等。数学操作d3.max和d3.min就是获取数据每一列的最大值和最小值的函数,示例代码如下 <!-- 加载d3 --> <script src="https://d3js.org/d3.v4.js"></script> <script&原创 2021-12-05 17:57:54 · 2326 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点4-饼图的问题
数据绘图要点4-饼图的问题本文让我们了解有史以来被批评最多的图表类型:饼图。坏的定义饼图是一个圆,分为多个部分,每个部分代表整体的一部分。它通常用于显示百分比,其中扇区的总和等于100%。问题是人类在阅读角度方面非常糟糕。在相邻的饼图中,尝试找出最大的一组,并尝试按值对它们进行排序。您可能很难这样做,这就是必须避免使用饼图的原因。让我们尝试比较3个饼图。尝试了解在这3个图形中哪个组的值最高。此外,尝试弄清楚群体之间的价值演变是什么。# Librarieslibrary(tidyverse)lib原创 2021-12-01 12:49:53 · 1308 阅读 · 0 评论 -
[数据与分析可视化] D3入门教程2-在d3中构建形状
d3.js入门教程2-在 d3.js中构建形状文章目录d3.js入门教程2-在 d3.js中构建形状形状的添加圆形的添加矩形的添加线段的添加文本的添加折线的添加区域的添加圆弧的添加参考d3.js是一个用于绘图的JavaScript 库。 它可以可视化展示任何类型的数据。 d3.js允许绘制形状,然后将各种形状构建一个图形。本文档描述了一些函数,可以更有效地从数据中绘制svg。形状的添加圆形的添加在svg中绘制圆形。需要三个参数:分别代表圆心x位置的cx、圆心y位置的cy和半径的r。基础调用函数如下原创 2021-11-28 15:28:15 · 1196 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点3-意大利面条图
数据绘图要点3-意大利面条图文章目录数据绘图要点3-意大利面条图绘图实例改进方法针对特定群体使用子图组合方法参考线条太多的折线图通常变的不可读,这种图一般被称为意大利面条图。因此这种图几乎无法提供有关数据的信息。绘图实例让我们以美国从1880年到2015年女性婴儿名字的演变为例。# Librarieslibrary(tidyverse)library(hrbrthemes)library(kableExtra)library(babynames)library(viridis)libr原创 2021-11-24 11:51:30 · 2325 阅读 · 0 评论 -
[数据与分析可视化] D3入门教程1-d3基础知识
d3.js入门教程1-d3基础知识文章目录d3.js入门教程1-d3基础知识1 HTML介绍1.1 什么是HTML?1.2 自定义文档样式CSS1.3 构建svg图形2 d3绘图入门2.1 使用Javascript和d3.js修改元素2.2 Console.log()2.3 坐标系2.4 比例尺2.5 添加轴2.6 边距和偏移2.7 数据绑定3 参考d3.js是一个用于绘图的JavaScript 库。 它可以可视化展示任何类型的数据。 本文档展示了多个交互式示例,说明了d3.js的关键概念,从而生成了第原创 2021-11-21 12:56:20 · 3056 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点2-Y轴的开始与结束
数据绘图要点2-Y轴的开始与结束切割或不切割Y轴可能是数据可视化中最具争议的话题之一。基本上,主要问题在于 Y 轴是否应始终从零开始。数据可视化的目的是讲述一个故事,图形表达方式会对可视化讲述的故事产生重大影响。好的可视化可以带出数据的重要方面,但可视化也可以用来隐藏或误导。我们将探讨这一看似简单的问题的一些微妙之处。Y轴的开始不好的实例让我们从显示问题的条形图开始。我们从一个众所周知的问题开始:绘制Y轴(因变量)不从0开始的条形图。条形图由德国经济发展机构 GTAI 创建,来自一个有关德国劳动力市原创 2021-11-18 11:47:35 · 1046 阅读 · 0 评论 -
[数据分析与可视化] 数据绘图要点1-注重数据排序
数据绘图要点1-注重数据排序文章目录数据绘图要点1-注重数据排序实例无序棒棒糖图有序棒棒糖图参考默认情况下,大多数数据可视化工具将使用字母顺序或使用输入表中的出现顺序对分类变量组进行排序。当显示多个实体项的值时,对它们进行排序会使得图表更具洞察力。实例无序棒棒糖图让我们从一个无序棒棒糖图开始,下面代码展示了一些国家出口的某一重要物品的数量。这里每一行代表一个国家,X 轴显示2017 年销售的重要物品数量。默认情况下,国家按字母顺序排列。# Librarieslibrary(tidyverse)原创 2021-11-14 10:45:06 · 1012 阅读 · 0 评论 -
[python] 圆形嵌套图Circular Packing
圆形嵌套图Circular Packing文章目录圆形嵌套图Circular Packing1 具有一级层次的圆形嵌套图绘制1.1 绘图数据与circlify计算1.2 图形绘制1.2.1 基础图形绘制1.2.2 视觉调整1.2.3 圆形之间的空间设置2 具有多级层次的圆形嵌套图绘制2.1 绘图数据与circlify计算2.2 图形绘制3 circlify自带绘图函数4 参考圆形嵌套图Circular Packing能够将一组组圆形互相嵌套起来,以显示数据的层次关系。本文主要基于circlify实现圆原创 2021-07-23 12:09:02 · 2542 阅读 · 2 评论 -
[数据分析与可视化] 科技论文配色心得
本文是制作论文中科学图形的一些建议,可帮助您的论文受众尽可能轻松地理解您的数据。您的图形应该引人注目,易于理解,应该避免扭曲数据(除非您真的想这样做),并且对色盲的人来说是安全的。请记住,没有真正“正确”或“错误”的绘图规则(好吧,也许有一些错误的),但是研究一些简单的规则和示例将帮助您只传达您的意图。文章目录1 论文配色入门1.1 颜色的分类1.2 论文配色基本原则1.2.1 柱状图配色1.2.2 饼图配色1.2.3 折线图配色1.2.4 散点图1.2.5 等高线图1.2.6 热图2 绘图实用工具2.1原创 2021-06-27 10:29:20 · 13479 阅读 · 0 评论 -
[常用工具] mermaid学习笔记
mermaid学习笔记原创 2021-05-22 17:15:02 · 3237 阅读 · 1 评论 -
[深度学习] 深度学习优化器选择学习笔记
本文主要展示各类深度学习优化器Optimizer的效果。所有结果基于pytorch实现,参考github项目pytorch-optimizer(仓库地址)的结果。pytorch-optimizer基于pytorch实现了常用的optimizer,非常推荐使用并加星该仓库。文章目录1 简介2 结果A2GradExp(2018)A2GradInc(2018)A2GradUni(2018)AccSGD(2019)AdaBelief(2020)AdaBound(2019)AdaMod(2019)Adafactor原创 2020-11-19 17:54:35 · 1913 阅读 · 0 评论 -
[R语言] 基于R语言实现树形图的绘制
树状图(或树形图)是一种网络结构。它由一个根节点组成,根节点产生由边或分支连接的多个节点。层次结构的最后一个节点称为叶。本文主要基于R语言实现树形图的绘制。关于python实现树形图的绘制见:基于matplotlib实现树形图的绘制之所以还用R语言实现树形图的绘制,主要原因在于R语言所实现的树形图比python实现的更加多样。R语言树形图提供以下两种类型:分层树形图:类似CEO管理团队领导管理员工等等。聚类树形图:聚类将一组个体按相似性分组。它的结果可以可视化为一棵树。本文主要参考:Dendro原创 2020-09-05 10:10:23 · 10435 阅读 · 0 评论 -
[R语言] 基于R语言实现环状条形图的绘制
环状条形图(Circular barplot)是条形图的变体,图如其名,环状条形图在视觉上很吸引人,但也必须小心使用,因为环状条形图使用的是极坐标系而不是笛卡尔坐标系,每一个类别不共享相同的Y轴。环状条形图非常适合于周期性数据,本文主要介绍基于R语言实现环状条形图的绘制。本文主要参考链接:Circular barplotR语言的环状条形图主要基于tidyverse包实现,tidyverse是一组R包的集合,这些R包共享共同的原理并旨在无缝地协同工作,具体介绍见:tidyverse安装命令如下:in原创 2020-09-05 09:59:58 · 8100 阅读 · 0 评论 -
[python] 基于matplotlib实现圆环图的绘制
圆环图本质上是一个中间切出一块区域的饼状图。可以使用python和matplotlib库来实现。本文主要介绍基于matplotlib实现圆环图。本文所有代码见:Python-Study-Notes# 去掉警告import warningswarnings.filterwarnings("ignore")# 多行输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interact原创 2020-09-01 19:05:16 · 13564 阅读 · 0 评论 -
[python] 基于matplotlib实现雷达图的绘制
雷达图(也称为蜘蛛图或星形图)是一种可视化视图,用于使用一致的比例尺显示三个或更多维度上的多元数据。并非每个人都是雷达图的忠实拥护者,但我认为雷达图能够以视觉上吸引人的方式比较不同类别各个特征的值。本文主要讲述通过matplotlib绘制雷达图。本文所有代码见:Python-Study-Notes# 去掉警告import warningswarnings.filterwarnings("ignore")# 多行输出from IPython.core.interactiveshell import原创 2020-09-01 19:03:52 · 17658 阅读 · 0 评论 -
[机器学习] Yellowbrick使用笔记8-模型选择可视化
Yellowbrick可视化工具旨在指导模型选择过程。一般来说,模型选择是一个搜索问题,定义如下:给定N个由数值属性描述的实例和(可选)一个估计目标,找到一个由特征、算法和最适合数据的超参数组成的三元组描述的模型。在大多数情况下,“最佳”三元组是指收到模型类型的最佳交叉验证分数的三元组。代码下载Yellowbrick.model_select包提供了可视化工具,用于检查交叉验证和超参数调优的性能。许多可视化工具包装sklearn.model_select和其他工具中的功能,用于执行多模型比较。当前实原创 2020-07-25 11:36:00 · 791 阅读 · 0 评论 -
[机器学习] Yellowbrick使用笔记7-聚类可视化
聚类模型是试图检测未标记数据中模式的无监督方法。聚类算法主要有两类:聚集聚类将相似的数据点连接在一起,而质心聚类则试图在数据中找到中心或分区。Yellowbrick提供yellowbrick.cluster用于可视化和评估群集行为的模块。目前,我们提供了几种可视化工具来评估质心机制,特别是K均值聚类,帮助我们发现聚类度量中的最佳K参数。代码下载主要方法如下:Elbow Method:根据某个评分函数对聚类进行可视化,在曲线中寻找“Elbow”。Silhouette Visualize:在一个模型中原创 2020-07-25 11:16:44 · 3664 阅读 · 0 评论 -
[机器学习] Yellowbrick使用笔记6-分类可视化
分类模型试图在一个离散的空间中预测一个目标,即为一个因变量实例分配一个或多个类别。代码下载分类分数可视化工具显示类之间的差异以及一些特定于分类器的可视化评估。我们目前已经实施了以下分类器评估:分类报告Classification Report:视觉分类报告,将每个类别的精度,召回率和F1显示为热图。混淆矩阵Confusion Matrix:多类分类中混淆矩阵的热图视图。ROCAUC: 绘制训练器的工作特性和曲线下面积Precision-Recall曲线:绘制不同概率阈值的精度和召回率。类平衡原创 2020-07-25 11:04:08 · 1880 阅读 · 0 评论 -
[机器学习] Yellowbrick使用笔记5-回归可视化
回归模型试图预测连续空间中的目标。回归计分可视化工具显示模型空间中的实例,以便更好地理解模型是如何进行预测的。我们目前已经实施了三种回归评估:残差图Residuals Plot:绘制期望值与实际值之间的差预测误差图Prediction Error Plot:在模型空间中绘制期望值与实际值alpha选择:视觉调整正则化超参数库克距离Cook’s Distance:描述了单个样本对整个回归模型的影响程度Estimator score Visualizer包装Scikit Learn estimat原创 2020-07-25 10:49:30 · 1533 阅读 · 0 评论 -
[机器学习] Yellowbrick使用笔记4-目标可视化
目标可视化工具专门用于直观地描述用于监督建模的因变量,通常称为y目标。代码下载当前实现了以下可视化:平衡箱可视化Balanced Binning:生成带有垂直线的直方图,垂直线显示推荐值点,以将数据装箱到均匀分布的箱中。类平衡Class Balance:可视化来检查目标,以显示每个类对最终估计器的支持。特征相关Feature Correlation:绘制特征和因变量之间的相关性。文章目录1 平衡箱可视化Balanced Binning1.1 基本使用1.2 快速方法2 类平衡Class Ba原创 2020-07-25 10:31:35 · 1057 阅读 · 0 评论 -
[机器学习] Yellowbrick使用笔记3-特征分析可视化
特征分析可视化工具设计用于在数据空间中可视化实例,以便检测可能影响下游拟合的特征或目标。因为ML操作高维数据集(通常至少35个),可视化工具将重点放在聚合、优化和其他技术上,以提供对数据的概述。这是Yellowbrick的意图,指导过程将允许数据科学家缩放和过滤,并探索他们的实例和维度之间的关系。代码下载目前,我们实现了以下功能分析可视化工具:特征排名Rank Features:对单个特征和成对特征进行排名以检测协方差RadViz Visualizer:沿围绕圆形排列的轴绘制数据点以检测可分离性平原创 2020-07-25 10:16:42 · 1516 阅读 · 0 评论 -
[机器学习] Yellowbrick使用笔记2-模型选择
在本教程中,我们将查看各种Scikit Learn模型的分数,并使用Yellowbrick的可视化诊断工具对它们进行比较,以便为我们的数据选择最佳的模型。文章目录1 使用说明1.1 模型选择三原则1.2 关于数据1.3 特征提取1.4 建模与评估1.4.1 评估分类器的通用指标1.4.2 视觉模型评估2 参考1 使用说明1.1 模型选择三原则关于机器学习的讨论通常以单一的模型选择为特点。不管是logistic回归、随机森林、贝叶斯方法,还是人工神经网络,机器学习的实践者通常很快就能表达他们的偏好。原原创 2020-07-25 09:41:25 · 1088 阅读 · 0 评论