Excel数据可视化—波士顿矩阵图【四象限图】

本文详细介绍了Excel在数据分析中的实用功能,如函数公式和图表美化,特别是波士顿矩阵图的制作过程,包括数据准备、绘图技巧和解读方法。作者强调Excel在某些场景下的高效性,以及如何根据实际业务调整图表设计。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

EXCEL系列文章目录

  Excel系列文章是本人亲身经历职场之后萌发的想法,为什么Excel覆盖如此之广,几乎每个公司、学校、家庭都在使用,但是它深藏的宝藏功能却很少被人使用,PQ、BI这些功能同样适用于数据分析;并且在一些需要简单及时的数据分析项目前,Excel是完胜python、R、SPSS这些科学专业的软件的。因此决心开启Excel篇章。

数据分析为什么要学Excel
Excel图表美化—表格美化
Excel函数公式大全—IF函数
Excel函数公式大全—IF家族函数
Excel函数公式大全—VLOOKUP函数
Excel函数公式大全—MATCH函数
Excel函数公式大全—INDEX函数
Excel函数公式大全—HLOOKUP函数
Excel函数公式大全—LOOKUP函数
Excel函数公式大全—SUMIF/SUMIFS函数
Excel函数公式大全—函数真经



效果图

请添加图片描述
  啥也别说,咱们先看效果图【波士顿矩阵图】又有人称【四象限图】名字不重要,我们先解析一下图所要展示的意思:

  • 坐标轴没有展示名字,此处展示各省份的评价得分(Y轴)与销售额(X轴)的关系;横纵坐标交于图像中间将图片分割为四个象限因此的名【四象限图】
  • 根据两项得分可分为:高得分低销售、高得分高销售、低得分低销售、低得分低销售区域
  • 针对不同区域制定不一样的政策方针,实行不一样的管理制度,具体根据实际业务实施

  图表是数据的具象化,图是数据的直观展示,表是数据的高度汇总。本系列文章没有对图和表的推荐偏好引导,各位可以根据实际所需进行取舍。💯


原理

  波士顿矩阵(Matrix: Boston Consulting Group)简称BCG,又称市场增长率-相对市场份额矩阵、四象限分析法、产品系列结构管理法等。波士顿矩阵由美国著名的管理学家、波士顿咨询公司创始人布鲁斯·亨德森于1970年创作。
  波士顿矩阵认为一般决定产品结构的基本因素有两个:即市场引力与企业实力。市场引力包括整个市场的销售量(额)增长率、竞争对手强弱及利润高低等。其中最主要的是反映市场引力的综合指标——销售增长率,这是决定企业产品结构是否合理的外在因素。
在这里插入图片描述
  以上原理来源百度,可见波士顿矩阵分析最开始是在做产品策略;随着广泛应用,结合多业务场景,也就范化为了四象限图。凡是根据两个指标去对产品、营业员、区域等进行分类时,就能高频的看见这个图表。话不多说,我们开始教学💪…


实现过程

数据准备

请添加图片描述
  数据随机挑选了几个城市,构造两个指标;
  值得注意的是在实际应用中,两个指标应相互独立最佳,避免相互影响。

绘图

请添加图片描述
  因为EXCEL没有可以直接绘画波士顿矩阵的选项,需要通过散点图实现。 本人使用的是excel2019版本,如果后续更新出这个功能那就更简单了。
  注: 选取数据时只选取两列指标值,插入散点图的时候选取最基础的散点图。
请添加图片描述
  此时得到最基本的散点图,需要我们进行美化加工;请添加图片描述
  首先去掉标题和网格线,你就能得到下图:
请添加图片描述
  接着我们需要对坐标轴进行调整,首先看下Y轴的调整:
请添加图片描述

请添加图片描述

  单击Y轴,然后设置坐标轴格式,按照上图的框选进行调节,改变坐标轴的范围,交点及标签位置,你就能得到下图:
请添加图片描述
  同理我们对X轴的调整:请添加图片描述
  注: 关于坐标轴的调整范围及交点没有统一的标准;坐标轴范围尽可能的贴近数据的最大最小值;坐标轴交点则可以根据实际的业务场景;如中值、平均值、达标值等都是优先选择的数据;
  到这一步你已经得到了一个近乎完美的图了:
请添加图片描述
  接下来的操作是excel可视化技巧中最常用的改变标签值:请添加图片描述
请添加图片描述
  首先调成标签值;然后设置数据标签格式,标签包含单元格中的值:请添加图片描述
  得到这样得图之后,先按上图得步骤去数据标记填充。
请添加图片描述
  去数据标记后,我们需要把我们想要显示的城市显示在原来数据点的位置,就按上图去设置标签格式。请添加图片描述
  看到这儿就得恭喜你已经懂了excel一个波士顿矩阵的绘制技巧了,如果你是跟着操作到这儿,那你可太厉害了,算是掌握了绘画技巧,可以在工作中大秀一下了。
  目前可以先放松放松,点赞+收藏,我们接着往下美化一下。
请添加图片描述

请添加图片描述
  选中整个图表,我们就可以在菜单栏对字体、颜色、填充、阴影等效果进行调节。这部分因人而异,各自审美不同,品牌主题色也不同。

图表解读

请添加图片描述

  此处说明一下,该图选取的指标是各城市的销售额与经营得分之前的关系坐标轴交点为平均销售额 2400 与经营得分达标值 60分;各数据点与坐标轴的距离就是与平均值的差距值。

  • 从X轴来看,左边是低于平均水平,右边是高于平均水平。
  • 从Y轴来看,下边是低于及格60分,上边是高于及格60分。

  简单分析一下:

  • 黑龙江与山西:销售额与经营得分均高于平均水平,是可以作为推广,标杆式城市的经营方式。
  • 吉林、广西、陕西:销售额虽然高于平均水平,但是经营得分不达标,可能存在卫生、服务、售后等差的地方。
  • 重庆、江西、新疆:经营得分高,但是销售额低;可以深入探究一下该城市的市场是否还有很大空间,或仅做了经营得分的事项,对于增加销售额的活动政策等没有推广。
  • 海南、安徽等城市:需要重点关注的地方,双双不达标,必定是经营出现问题。

总结:准备数据—绘画散点图—调整XY坐标轴—修改数据标签

  今天的分享就到这里啦;商务报表类的报表根据使用的对象不一样,大家可以根据不同的需求,在不脱离核心的范围内调整均可。最终以简单明了,突出重点为主,在阅读消化完上面的知识后;小伙伴们根据上面的案例自己动手试一下吧。
  如果你觉得还有用的话就收藏吧、点赞+关注 | 咱们下期再会!
请添加图片描述

### 关于GSEA四象图的绘制 GSEA(Gene Set Enrichment Analysis)是一种用于识别与表型显著相关的基因集合的方法。而所谓的“四象图”,通常是指通过将基因按照其表达变化趋势以及功能富集情况划分为四个区域,从而更直观地展示不同基因集合之间的关系。 以下是基于R语言实现GSEA四象图的具体方法: #### 数据准备 为了绘制GSEA四象图,需要先完成以下准备工作: 1. 差异基因列表及其对应的logFC值。 2. 使用`clusterProfiler`或其他工具进行GSEA分析并获取结果数据框。 3. 提取每个基因集合的关键统计量,如NES(Normalized Enrichment Score)、p-value、FDR等。 ```r library(clusterProfiler) library(enrichplot) # 假设已经完成了差异分析,并得到了如下形式的数据 data <- read.csv("diff.SYMBOL.csv", header = TRUE, stringsAsFactors = FALSE) names(data)[1] <- "gene" names(data)[2] <- "logFC" # 构建基因列表 genelist <- data$logFC names(genelist) <- data$gene genelist <- sort(genelist, decreasing = TRUE) genelist <- genelist[genelist != 0] # 运行GSEA分析 set.seed(1234) res <- GSEA( genelist, nPerm = 1000, pvalueCutoff = 1, pAdjustMethod = "BH", TERM2GENE = term2gene, # 需要提前定义好TERM2GENE矩阵 TERM2NAME = term2name, # 需要提前定义好TERM2NAME矩阵 seed = TRUE ) ``` #### 绘制四象图 利用提取的GSEA结果数据,可以进一步构建四象图。这里推荐使用`ggplot2`库来进行自定义绘图。 ```r library(ggplot2) # 转换GSEA结果为适合绘图的形式 df <- as.data.frame(summary(res)) df$logFC <- log(df$p.adjust, base = 10) * -1 # 将-log10(FDR)作为y轴坐标 df$x <- df$NES # NES作为x轴坐标 # 定义颜色映射规则 color_mapping <- ifelse(df$p.adjust < 0.05, "Significant", "Not Significant") # 创建四象图 p <- ggplot(df, aes(x = x, y = logFC)) + geom_point(aes(color = color_mapping), size = 3) + theme_minimal() + labs(title = "GSEA Quadrant Plot", subtitle = "Visualization of Gene Sets Based on NES and -log10(FDR)", x = "Normalized Enrichment Score (NES)", y = "-log10(FDR)") + scale_color_manual(values = c("Significant" = "#D55E00", "Not Significant" = "#999999")) + geom_hline(yintercept = -log10(0.05), linetype = "dashed", color = "gray") + geom_vline(xintercept = 0, linetype = "dashed", color = "gray") print(p) ``` 此代码片段实现了以下功能: - **X轴**表示标准化富集得分(NES),反映基因集合在样本组间的相对重要性[^1]。 - **Y轴**表示-log10调整后的P值(FDR),衡量该基因集合是否具有统计学意义[^2]。 - 图形被划分为四个象限,分别代表不同的生物学含义:正向显著、负向显著、不显著但有趋势、完全无关联等[^3]。 如果希望用Python实现类似的图表,则可借助`matplotlib`或`seaborn`库完成相似效果。 ```python import pandas as pd from matplotlib import pyplot as plt import seaborn as sns # 加载GSEA结果文件 result_df = pd.read_csv('gsea_results.csv') # 计算-log10(FDR) result_df['neg_log_fdr'] = -np.log10(result_df['fdr']) # 设置颜色分类 result_df['significance'] = result_df.apply(lambda row: 'Significant' if row['fdr'] < 0.05 else 'Not Significant', axis=1) # 绘制散点图 plt.figure(figsize=(8, 6)) sns.scatterplot(data=result_df, x='nes', y='neg_log_fdr', hue='significance', palette=['#D55E00','#999999'], s=100) plt.axhline(-np.log10(0.05), linestyle="--", color="gray") plt.axvline(0, linestyle="--", color="gray") plt.title('GSEA Quadrant Plot') plt.xlabel('Normalized Enrichment Score (NES)') plt.ylabel('-log10(FDR)') plt.legend(title='Significance') plt.show() ``` 以上脚本能够帮助研究者快速理解哪些基因集合既表现出较高的富集程度又具备较强的统计支持度。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

铭记yu心

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值