自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 世界杯的时空演变与制胜因素分析(1930-2014)

本研究基于 1930-2014 年世界杯足球赛的三个核心数据集(赛事概况、比赛详情、球员事件),从宏观、中观、微观三个维度构建分析框架,揭示世界杯的历史演变规律与制胜关键因素。研究发现:世界杯赛事规模呈阶梯式扩张,参赛球队从 13 支增至 32 支,场均进球数呈长期下降趋势(从 3.89 球降至 2.67 球);东道主球队存在显著主场优势,胜率(70.24%)较非东道主主场球队(55.86%)高出 14.38 个百分点;冠军球队具有 “高进攻效率 + 强防守稳定性” 特征,场均进球(2.42)是普通球队(1

2025-12-17 17:50:12 429

原创 Python可视化进阶——用豆荚图展示多维数据关系

豆荚图是一种融合箱线图与核密度曲线的创新可视化图表,通过镜像对称的"豆荚"形状同时展示数据分布的中位数、四分位数和密度曲线。相比传统箱线图,它能直观呈现单峰、双峰等分布形态,特别适合比较多组数据的分布差异。本文通过电商用户行为分析案例,对比了箱线图和豆荚图的效果:箱线图将低频购买行为识别为异常点,而豆荚图则清晰展现了用户行为从收藏、加购到购买的全流程分布,更易发现"加购→购买"这一关键转化瓶颈。豆荚图通过归一化密度曲线和镜像填充技术,在有限空间内高效传达多维数据信息。

2025-12-10 16:47:36 691

原创 弦图与桑基图:数据流可视化的双剑合璧

弦图和桑基图是两种可视化关系数据的图表类型。弦图以圆形布局展示实体间的相互关系,用弧线宽度表示关系强度,适用于分析社交网络、合作关系等场景。桑基图则通过流动的"河流"展示能量、物料或资金的转移过程,强调流量守恒,常用于分析资金流向、用户转化等场景。本文详细介绍了两种图表的适用场景,并以弦图为例展示了绘制流程,包括节点布局、贝塞尔曲线生成等关键技术细节,提供了完整的Python实现代码。

2025-12-08 21:41:55 882

原创 计算向量和矩阵的范数

本文系统梳理了范数在机器学习和最优化中的核心作用。范数作为统一度量工具,通过非负性、齐次性和三角不等式三大公理,将"长度"概念推广至向量、矩阵等数学对象。重点介绍了3种向量范数(L1曼哈顿范数、L2欧几里得范数、L∞无穷范数)和4种矩阵范数(列和最大值、行和最大值、谱范数、弗罗贝尼乌斯范数),每种范数均给出定义、公式、计算示例和Python实现代码。这些范数在稀疏建模、数值分析和算法设计中具有重要应用价值。

2025-10-11 12:54:31 937

原创 Matplotlib数据分析与可视化--雷达图

摘要:雷达图能直观展示多维数据分布,有效识别异常值与结构差异。本文通过两个实例验证其应用价值:1)高校学生专业课程成绩雷达图可快速呈现学科优势与短板,辅助招聘决策;2)家庭月度支出雷达图可精准定位消费异常点,优化预算管理。实验表明,在12维以内数据场景中,雷达图对极值和离群值的识别效率显著优于传统图表。Matplotlib实现的极坐标转换方法仅需数据闭合、角度均分与视觉编码三个步骤,即可将复杂表格转化为直观图形。该方法可扩展至绩效评估、产品对比等商业分析场景,具有广泛适用性。(149字)

2025-09-15 17:43:41 1045 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除