- 博客(13)
- 收藏
- 关注
原创 相关类可视化图像
散点图:基础双变量分析工具,直观展示原始数据分布与异常值,适合小数据集初步探索,但存在数据重叠问题。二维密度图:大数据集解决方案,用颜色梯度揭示分布密度,有效克服散点图重叠问题,但会损失精确数据位置。气泡图:升级版散点图,通过气泡大小引入第三维度,适合多维数据比较,需注意气泡大小易产生视觉误导。这些工具形成从探索到解释的完整分析链条,根据数据特性和分析目标灵活组合,可全面把握变量关系本质。热力图:多变量关系矩阵呈现,快速识别强相关变量对,是特征选择的利器,但仅限两两关系分析。回归分析必配可视化验证。
2025-06-09 11:02:54
698
原创 地理特征类可视化图像
例如,在展示各国人口数量时,人口众多的国家在地图上会被放大,而人口较少的国家则会被缩小,这种直观的视觉效果能够帮助人们快速了解数据的分布情况。以 GDP 对比为例,通过在地图上各省份的位置处绘制大小不一的气泡,气泡的大小与该省份的 GDP 数值成正比,可以直观地展示各省份之间的经济规模差异。它以点的形式表示数据的存在,点的密度越高,表示该区域的数据值越大,这种直观的视觉效果有助于我们快速了解数据的分布特点。它为数据的展示提供了一种独特的方式,使我们能够更直观地观察数据在地理空间上的分布情况。
2025-05-25 17:24:50
1781
原创 数据可视化交互
Pyecharts 在绘制中国风格的图表方面表现出色,提供了丰富的图表类型和简洁的接口;将复杂的 AQI 数据转化为直观的图表形式,能够帮助用户快速理解数据背后的信息,如空气质量的地域差异、污染程度的分布等。这种直观的展示方式不仅便于专业人士进行深入分析,也能让普通公众更便捷地获取环境信息,提高公众对环境问题的关注度和参与度。在实验中,我花费了大量时间处理数据文件的格式问题、缺失值等,以确保数据能够被正确解析和利用。同时,我也认识到图表的设计和呈现方式直接影响用户对数据的理解。用户体验良好的可视化应用。
2025-05-19 21:04:31
854
原创 文本数据可视化
生成词云图,需要注意的是WordCloud 默认不支持中文,所以这里需已下载好的中文字库。结巴中文分词,生成字符串,默认精确模式,如果不通过分词,无法直接生成正确的中文词云。理解需求均纷繁复杂。例如,对于同一个文本,不同的人的解。读也是不一样的,有的人希望了解文本中涉及到的事物,而有。信息挖掘方法也不同,词汇级当然是用各类分词算法,语法级。别多种多样,包括单文本、文档集合和时序文本数据三大类,的人希望得到文本中的关键词。文本是语言和沟通的载体,文本的含义以及读者对文本的。3、编写代码,构造不同形状的词云。
2025-05-18 20:27:25
702
原创 时间趋势类可视化图表总结
选择合适的时间趋势可视化图表应根据数据特点、分析目的和受众需求综合考虑。简单趋势分析可使用折线图,多序列比较可考虑地平线图或河流图,金融数据适合烛形图,而项目管理则适合甘特图。时间趋势类可视化图表用于展示数据随时间变化的模式和趋势。以下是几种常见的时间趋势可视化图表及其特点、应用场景和Python实现方法。
2025-05-12 21:47:05
1905
原创 关系数据的可视化
其实最重要的一点,就是数据进行可视化后,呈现眼前的图表,它的意义何在。进行可视化,有散点图,直方图,密度分布曲线,气泡图,散点矩阵图等等。直方图是反应数据的密集程1度,是数据分布范围的描述,与茎叶图类似,但是不会具体到某一个值,是一个整体分布的描述。计算了七种犯罪类型之间的相关性矩阵,并使用 seaborn 的 heatmap 函数绘制热力图,直观展示了相关系数的大小和正负关系。数据预处理的重要性:深刻认识到数据预处理在数据分析中的重要性,特别是在处理实际数据时,数据清洗和列名检查是不可或缺的步骤。
2025-05-04 21:22:04
1928
原创 分布类可视化图像
细节分析:密度图或小提琴图(sns.kdeplot(), sns.violinplot())。根据数据量和分析目标选择合适的图表,必要时可组合使用(如箱线图叠加小提琴图)。每个小提琴的宽度反映数据密度,内部白线为中位数,黑色条为四分位距。每组的中位数、四分位距(IQR)和异常值(须线外的点)清晰可见。直接显示数据中小于某值的比例,横轴为数值,纵轴为累积概率。对比两组数据的分布差异(如两组实验结果的累积分布)。对比多个分布的密度差异(如男女身高分布)。对比多组数据的分布细节(如双峰分布)。
2025-04-20 16:52:55
1012
原创 绘制板块层级图
该代码使用 squarify 库绘制了一个树状图(Treemap),展示不同商品部门(department)的通道数(aisle_department)和产品数(products_department)的层级关系。板块层级图(treemap)是一种基于面积的可视化方式,通过每一个板块(通常。一、安装pandas、matplotlib、seaborn、squarify。们也可以通过板块层级图简单的呈现比例关系,不过它更擅于呈现树状结构的数。读取绘图所用的数据,并对数据进行处理将数据处理成我们可以使用的形式,
2025-04-20 15:24:36
969
原创 总结(局部与整体类可视化图像)
局部与整体类图表用于展示部分与整体的比例关系或层次结构,适用于分类数据或层级数据的可视化。通过合理选择图表类型和工具,可高效传达局部与整体的关系,提升数据分析的直观性。结果:显示两个圆形,重叠部分表示交集,数字标注各区域元素数量。结果:多层环形嵌套,颜色区分层级,点击可展开/折叠分支。结果:环形显示比例,中心空白处可添加标题或关键指标。结果:圆形图表显示各分类占比,突出最大/最小部分。结果:多个圆形按面积比例排列,形成紧凑的嵌套布局。圆形分割为扇形,面积比例反映数据占比。数据简单:优先选择饼图或环形图。
2025-04-06 23:40:28
365
原创 实验三:时间数据的可视化
这里就讲述下离散型数据的堆叠柱形图,堆叠柱形图的几何形状和常规柱形图很相似,在柱形图中,数据值为并行排列,而在堆叠柱图则是一个个叠加起来的。总的来说,本次实验让我对时间数据的可视化有了更深入的理解,也提高了我的数据处理和图表绘制能力。通过实验,我学会了如何利用Python程序实现堆叠柱形图的可视化,并能够根据数据的特点选择合适的图表类型。只有经过清洗和整理的数据,才能为后续的分析和可视化提供可靠的基础。通过实验,我不仅掌握了时间数据在大数据中的应用,还学会了如何利用Python程序实现堆叠柱形图的可视化。
2025-04-01 22:03:07
897
原创 排序与比较类可视化图像总结
优势:支持分组/堆积形式,适合少量类别(<10)的横向或纵向对比。适用场景:时间周期数据展示、多类别环形布局(如基因表达分析)。适用场景:高维数据分类(如鸢尾花数据集)、异常值检测。适用场景:能力评估(如员工技能)、产品多维度评测。适用场景:KPI进度监控、预算执行率、绩效评估。适用场景:政策实施效果对比、性别/地区差异分析。适用场景:销售额对比、产品排名、分类数据分布。优势:节省空间,适合周期性数据(如月份对比)。优势:直观展示时间或组别差异(如前后对比)。适用场景:用户评论关键词提取、舆情热点分析。
2025-03-24 00:23:50
361
原创 D3数据可视化基础
on()的第一个参数是监听的事件,第二个参数是监听到事件后响应的内容,第二个参数是一个函数。未来,我将继续深入学习D3.js的高级功能,探索更多复杂图表的绘制方法,并尝试将其应用于实际项目中,以提升数据可视化的效率和效果。在实验过程中,我首先通过制作简单的柱形图,熟悉了D3.js的基本操作流程,包括HTML框架的搭建、SVG画布的添加、数据的定义以及比例尺的使用。D3.js作为一个基于JavaScript的数据可视化库,不仅提供了丰富的绘图工具,还通过其简洁的API设计,使得复杂的图表绘制变得简单易行。
2025-03-17 20:28:16
661
原创 Tableau数据可视化入门
界面的左边指示数据的来源,Tableau可以连接到本地的Excel表格,文本, Access数据库,统计文件等,也可以连接数据库服务器,例如MicrosoftSQLServer 数据库,MySQL数据库,Oracle数据库等。中间上部分显示最近打开过的工作薄,下部分显示示例工作薄,即Tableau自带 的一些工作薄,可以点击更多样本查看更多的数据图。Tableau将数据分为:数字(十进制),数字(整数),字符串,布尔,日期, 日期和时间,还有地理类型(如果数据源中有城市,省份的数据可以分配为地理类 型)。
2025-03-17 20:00:37
889
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅