
数据可视化
文章平均质量分 93
艾派森
优快云内容合伙人、新星导师、大数据分析领域优质创作者、阿里云社区专家博主,热爱python(昵称的由来),专注于数据分析、数据挖掘,持续分享学习笔记,感谢关注与支持。专栏【大数据分析案例合集】,感兴趣的小伙伴速速订阅!接Python爬虫、数据分析、数据挖掘、机器学习等相关课程设计作业/毕设,有需求请私信我!需要领取博文代码、数据集、学习资料、进粉丝交流群、的小伙伴点击了解:https://bbs.youkuaiyun.com/topics/614636587
展开
-
数据分析案例-2024年QS世界大学排名数据可视化分析
数据集来源于Kaggle,原始数据集共有1498条,29个变量。关于数据集2024 年 QS 世界大学排名:全球顶尖大学第 20 版 QS 世界大学排名涵盖了 104 个地区的 1,500 所院校,是同类中唯一强调就业能力和可持续性的排名。今年,他们实施了有史以来最大规模的方法改进,引入了三个新指标:可持续性、就业成果和国际研究网络。该结果基于对 1750 万篇学术论文的分析以及超过 240,000 名学术教师和雇主的专家意见。原创 2024-09-19 10:59:48 · 13431 阅读 · 0 评论 -
数据分析案例-2024年裁员数据集可视化分析
本实验数据集来源于Kaggle,原始数据集为2020-2024年裁员数据,共有3577条,12个变量,该数据集提供了不同公司的裁员信息。它包括以下几栏:Company:裁员发生的公司名称。Location_HQ:公司总部位置。Industry:公司所属的行业或部门。Laid_Off_Count:公司解雇的员工数量。Percentage:公司员工被解雇的百分比。Date:裁员发生的日期。Source:信息来源网址。Funds_Raised:公司募集资金的信息。原创 2024-08-25 15:20:55 · 12344 阅读 · 93 评论 -
数据分析案例-2024 年热门动漫数据集可视化分析
本数据集来源于Kaggle,原始数据集共有1000条,22个变量。该数据集全面概述了 2024 年热门动漫,对于构建推荐系统、可视化动漫流行度和评分趋势、预测评分和流行度等非常有用。该数据集包含 22 个特征:Score:分配给每个动漫标题的评级或分数。Popularity:衡量每部动漫在观众中的受欢迎程度。Rank:数据集中每个动漫标题的排名。Members:与每部动漫相关的会员或观众数量。Description:每部动漫的情节和主题的简要概述或摘要。原创 2024-07-17 11:39:48 · 14050 阅读 · 112 评论 -
数据分析案例-2024 年全电动汽车数据集可视化分析
本数据集来源于Kaggle,原始数据集共有177866条数据,17个变量。该数据集显示了目前通过华盛顿州许可部 (DOL) 注册的电池电动汽车 (BEV) 和插电式混合动力电动汽车 (PHEV)。电池电动汽车 (BEV) 是一种全电动汽车,使用一个或多个电池来存储电能,为电机提供动力,并通过将车辆插入电源进行充电。插电式混合动力汽车 (PHEV) 是一种使用一个或多个电池为电动机提供动力的车辆;使用另一种燃料,例如汽油或柴油,为内燃机或其他推进源提供动力;并通过将车辆插入电源来充电。原创 2024-07-09 18:14:02 · 13832 阅读 · 89 评论 -
数据分析案例-钻石数据集可视化分析
本实验数据集来源于Kaggle,原始数据集共有53940条数据,10个变量,各变量解释如下:carat:克拉是衡量钻石重量的单位。一克拉相当于200毫克。cut:钻石的切割指的是它的比例、对称和抛光。这是决定钻石亮度和亮度的关键因素。color:钻石的颜色是指钻石是否有颜色。美国宝石学会(GIA)将钻石的颜色分为D级(无色)到Z级(浅黄色或棕色)。clarity:净度衡量钻石内部缺陷(内含物)和外部瑕疵(瑕疵)的存在。原创 2024-06-12 08:37:33 · 12362 阅读 · 90 评论 -
数据分析案例-在线食品订单数据可视化分析与建模分类
本实验数据集来源于Kaggle在线食品订单数据集该数据集包含一段时间内从在线订餐平台收集的信息。它包含与职业、家庭规模、反馈等相关的各种属性。Age:顾客的年龄。Gender:客户的性别。Marital Status:客户的婚姻状况。Occupation:客户的职业。Monthly Income:客户的月收入。Educational Qualifications:客户的教育资格。Family size:客户家庭中的人数。latitude:客户所在位置的纬度。原创 2024-05-31 21:08:00 · 11353 阅读 · 100 评论 -
数据分析案例-印度美食数据可视化分析
印度美食由印度次大陆本土的各种地区和传统美食组成。由于土壤、气候、文化、种族和职业的多样性,这些菜肴差异很大,并使用当地可用的香料、香草、蔬菜和水果。印度食物也深受宗教(特别是印度教)、文化选择和传统的影响。本数据集来源于Kaggle,原始数据集共有255条,8个变量,各变量含义解释如下:name : 菜肴名称ingredients:主要使用成分diet:饮食类型 - 素食或非素食prep_time : 准备时间Cook_time : 烹饪时间。原创 2024-05-16 09:22:13 · 17401 阅读 · 41 评论 -
数据分析案例-牛油果价格和销量数据可视化分析与预测
近年来,随着人们对健康饮食的关注度不断提高,牛油果作为一种营养丰富的食材逐渐受到消费者的青睐。然而,牛油果价格和销量的波动对生产者、零售商和消费者都产生了影响。为了更好地了解牛油果市场的变化趋势,本研究旨在通过可视化分析和预测牛油果价格和销量,为相关利益方提供决策支持。原创 2024-04-08 17:40:37 · 11665 阅读 · 136 评论 -
数据分析案例-国际象棋顶级棋手数据可视化分析
本数据集来源于Kaggle,原始数据集共有1071条,4个变量,各变量含义解释如下:GM:玩家的官方头衔Player:玩家姓名Rating | Ranking:国际棋联评级 |世界排名Federation:国际象棋棋手联合会关于此数据集利用此数据集探索国际象棋世界,该数据集包含顶级棋手、他们当前的评级、全球排名以及各自的联合会。深入了解国际象棋的竞争格局,深入了解各国顶尖棋手。原创 2024-03-23 09:14:45 · 11211 阅读 · 145 评论 -
数据分析案例- Netflix 电影和电视节目数据集可视化分析
本数据集来源于Kaggle,是 Netflix 电影和电视节目数据集,原始数据集共有8790条,10个变量,各变量含义如下:show_id:展出IDtype:内容(电视节目或电影)title:标题director:节目或电影的导演country:节目或电影的国家/地区date_added:添加到 Netflix 的日期release_year:内容发布年份rating:评级或限制duration:内容持续时间listed_in:内容类型。原创 2024-03-13 15:05:20 · 13601 阅读 · 172 评论 -
数据分析案例-二手车用户数据可视化分析
数据集来源于Kaggle,原始数据集为美国二手车市场用户数据,共有7906条,18个变量,各变量含义如下:Sales_ID(销售ID)name(二手车名称)year(购车年份)selling_price(二手车当前销售价格)km_driven(总行驶公里数)Region(使用地区)State or Province(使用的州或省)City(使用城市)fuel(燃料类型)seller_type(谁在出售汽车)transmission(汽车的变速器类型)owner(业主类型)原创 2024-03-06 10:38:58 · 13862 阅读 · 135 评论 -
数据分析案例-社交媒体情绪数据集可视化分析
本数据集来源于Kaggle,社交媒体情绪分析数据集捕捉了各种社交媒体平台上充满活力的情绪、趋势和互动。每个条目都揭示了世界各地的人们分享的独特故事——惊喜、兴奋、钦佩、兴奋、满足等等的时刻。原始数据集共732条,13个变量,各变量含义如下:Text:用户生成的内容展示情感Sentiment:情绪分类Timestamp:日期和时间信息User:贡献用户的唯一标识符Platform:内容起源的社交媒体平台Hashtags:识别热门话题和主题Retweets:量化用户参与度(喜欢)原创 2024-02-28 09:38:00 · 16932 阅读 · 142 评论 -
数据分析案例-2023年TOP100国外电影数据可视化
随着全球化的深入发展,电影作为一种文化表达和艺术形式,逐渐超越了国界,成为世界各地观众共同欣赏的对象。2023年TOP100国外电影榜单的发布,正是这一发展趋势的体现。为了更好地理解这一现象,我们决定对这100部电影进行数据可视化分析,以期揭示其背后的文化、市场和艺术特征。原创 2024-02-20 17:41:21 · 14746 阅读 · 145 评论 -
数据分析案例-基于亚马逊智能产品评论的探索性数据分析
数据成为新时代企业不可或缺的资产,不同行业、不同领域的公司都越来越注重数据在公司运营中发挥的作用,从谷歌、亚马逊到阿里、百度、腾讯,都因其拥有大量的用户注册和运营信息,成为天然的大数据公司。显然亚马逊早已开始尝试从数据中发掘价值,长期以来通过大数据分析,尝试定位客户并获取客户反馈,其不仅从每个用户的购买行为中获得信息,还将每个用户在网站上的所有行为都记录下来,充分体现了亚马逊对数据价值的高度敏感和重视及其强大的挖掘能力。原创 2024-02-15 15:03:01 · 19111 阅读 · 116 评论 -
数据分析案例-图书书籍数据可视化分析
数据集来源于Kaggle,这个数据集包含了从wonderbk.com(一个受欢迎的在线书店)抓取的信息。该数据集包含103,063本书的详细信息,其中包含标题、作者、描述、类别、出版商、起始价格和出版日期等关键属性。Title:书的标题。Authors:本书的作者。Description :对本书的简要描述。Category:书籍所属的类别或流派。Publisher:负责本书的出版社。Price:书籍的初始价格。Publish Date:出版年份。原创 2024-01-19 09:56:40 · 17799 阅读 · 124 评论 -
数据分析案例-外国电影票房数据可视化分析
该数据集来源于kaggle,该数据集包含1995年至2018年上映的电影类型统计数据,原始数据集共有300条,9个变量,各变量含义解释如下:Genre:电影的类别或类型。(分类)Year:电影发行的年份。(数字)Movies Released :特定类型和年份发行的电影数量。(数字)Gross:该类型和年份的电影产生的总收入。(数字)Tickets Sold:该类型和年份的电影售出门票总数。(数字)原创 2024-01-03 18:05:23 · 21528 阅读 · 144 评论 -
基于情感分析+聚类分析+LDA主题分析对服装产品类的消费者评论分析
本研究旨在通过对服装产品类的消费者评论进行综合分析,为企业提供更全面、更深入的市场洞察和决策支持。同时,本研究的方法和结果也可以为其他领域的消费者评论分析提供借鉴和参考。原创 2023-11-09 14:09:42 · 22661 阅读 · 177 评论 -
数据分析案例-基于服饰行业中消费者行为和购物习惯的可视化分析
本实验旨在借助可视化分析工具,深入探讨服饰行业中的消费者行为和购物习惯,以便制定更精准的市场策略和决策。原创 2023-11-06 16:33:55 · 15349 阅读 · 209 评论 -
数据分析案例-某公司员工数据信息可视化
本次实验旨在通过可视化工具和技术,分析和呈现公司员工数据信息。这种数据可视化对于公司管理和决策制定非常重要,可以帮助领导层更好地了解员工情况,优化流程,提高效率,和制定人力资源策略。原创 2023-10-26 11:22:53 · 15594 阅读 · 160 评论 -
数据分析案例-顾客购物数据可视化分析
本项目旨在通过数据可视化技术,对顾客购物数据进行深入挖掘和分析,为商家提供全面的市场分析和商业洞察。通过使用先进的数据可视化工具和技术,我们将从大量的顾客购物数据中提取有价值的信息,并通过直观的图形展示出来,帮助商家更好地理解市场和消费者行为,优化商业决策。原创 2023-10-22 08:53:32 · 18878 阅读 · 261 评论 -
智慧数据驱动:基于smardaten构建多维数据可视化大屏
前段时间有位粉丝找到我问数据可视化大屏怎么做,我说我之前的博文里介绍过基于Flask和Echarts搭建的大屏,你可以去看看。结果他来了句“没学过任何编程代码怎么办?”,好家伙,一下给我整懵了,于是为了解决这个问题,照顾零基础的粉丝,我花了几天时间找了个不需要代码就可以做可视化大屏的方法,这篇文章就讲手把手教会你搭建数据可视化大屏(无需代码)。数据可视化大屏是一种将数据以图表、图形、动画等形式展示在大屏幕上的技术。原创 2023-07-18 14:21:27 · 29698 阅读 · 160 评论 -
数据分析案例-数据分析师岗位招聘信息可视化
本次实验数据集来源于xx招聘网中关于数据分析师相关岗位的招聘信息,共计1600条数据,每条招聘信息包括岗位名称、公司、薪资、城市、工作类型、学历要求、工作经验要求等共51个字段。本次通过对数据分析师相关岗位的分析,我们发现数据分析相关岗位主要集中在北上广深等城市,以中大厂为主,经验要求以1-5年为主,学历以本科以上为主,平均薪资在15k左右,技能方面以SQL、可视化、BI、Python、Hadoop、Hive为主。原创 2023-07-18 08:55:38 · 11636 阅读 · 71 评论 -
数据分析案例-顾客购物数据可视化分析
本数据集来源于kaggle,原始数据集共有99457条,10个特征变量,各变量含义解释如下:Invoice_no:发票编号。标称。字母“I”和唯一分配给每个操作的 6 位整数的组合。customer_id:客户编号。标称。字母“C”和唯一分配给每个操作的 6 位整数的组合。gender:客户性别的字符串变量。age:顾客年龄的正整数变量。category:所购买产品的类别的字符串变量。quantity:每笔交易的每种产品(商品)的数量。数字。price:单价。数字。原创 2023-07-25 17:58:43 · 15777 阅读 · 144 评论 -
数据分析案例-航空公司满意度数据可视化
本数据来源于Kaggle,原始数据共有103904条,共23个特征,具体各变量含义如下:Gender:乘客性别(女、男)Customer Type:客户类型(Loyal customer, disloyal customer)Age:乘客的实际年龄Type of Travel:乘客的飞行目的(个人旅行、商务旅行)Class:乘客飞机的旅行等级(商务舱、经济舱、经济舱)Flight Distance:本次行程的飞行距离。原创 2023-06-13 18:00:00 · 13797 阅读 · 81 评论 -
基于Echarts构建停车场数据可视化大屏
本次项目是使用Echarts构建大数据招聘岗位信息可视化大屏,使用到的技术为前端三剑客(html、css、javascript)。原创 2023-06-11 17:14:54 · 10474 阅读 · 122 评论 -
数据分析案例-数据科学相关岗位薪资可视化分析
本数据集来源于kaggle,原始数据集共有3755条, 11列特征,各特征具体含义如下:work_year:发工资的年份。experience_level:该职位在一年内的经验水平employment_type:角色的雇佣类型job_title:这一年中工作的角色工资:支付的工资总额salary_currency:作为ISO 4217货币代码支付的工资的货币salaryinusd:以美元计算的工资。原创 2023-05-24 08:00:00 · 13002 阅读 · 148 评论 -
数据分析案例-BI工程师招聘岗位信息可视化分析
本次实验数据集来源于智联招聘网中关于BI工程师岗位的招聘信息,共计1800条数据,每条招聘信息包括岗位名称、公司、薪资、城市、工作类型、学历要求、工作经验要求共7个字段。1.目前BI工程师岗位在智联招聘网站的平均薪资为13.5K,主要薪水区间大概在12-15K。2.从城市岗位需求数量分布来看,BI工程师需求主要集中在北京、上海、深圳、广州区域;各国内排在前面的分别为深圳(15.63K)、上海(15.62K)、北京(15.52)、杭州(12.07K)、成都(11.69K)、广州(11.19K)。原创 2023-05-15 15:55:37 · 13252 阅读 · 113 评论 -
用Python爬取电影数据并可视化分析
本次实验通过使用爬虫获取2016年-2023年的电影数据,并可视化分析的得出以下结论:1.2016年-2019年电影数量逐渐增大,2019年达到最大值,从2020年开始迅速逐年下降。2.发布电影数量最多的国家是中国和美国。3.电影类型最多的剧情片。4.电影片长呈正态分布,且片长和评分呈正相关关系。原创 2023-04-10 17:15:51 · 30949 阅读 · 165 评论 -
基于Echarts构建大数据招聘岗位数据可视化大屏
本次项目是使用Echarts构建大数据招聘岗位信息可视化大屏,使用到的技术为前端三剑客(html、css、javascript)。原创 2023-01-24 09:39:33 · 18991 阅读 · 99 评论 -
数据分析案例-往届世界杯数据可视化
数据集来源于天池,世界杯成绩信息表:WorldCupsSummaryYear: 举办年份HostCountry: 举办国家Winner: 冠军队伍Second: 亚军队伍Third: 季军队伍Fourth: 第四名队伍GoalsScored: 总进球数QualifiedTeams: 总参赛队伍数MatchesPlayed: 总比赛场数Attendance: 现场观众总人数HostContinent: 举办国所在洲。原创 2022-12-14 12:30:45 · 12038 阅读 · 26 评论 -
数据分析案例-大数据相关招聘岗位可视化分析
本次数据集来源于xx招聘网共计4223条招聘信息,每条招聘信息字段包括岗位名称、公司名称、工作经验要求、学历要求、工作地点、薪酬、公司规模、发布时间、公司福利共9条字段信息。原创 2022-11-25 10:45:15 · 13468 阅读 · 43 评论 -
数据分析案例-四川省旅游景点数据分析
数据为四川省的各旅游景点信息,特征有景点名称、星级、城市、票价、销量、热度6个维度,部分数据如下:首先要导入本次项目用到的第三方包和数据 我们发现数据没有缺失值,不需要进行缺失值处理 如有缺失值,调用下面代码进行删除处理即可重复值处理 查看数据是否有重复值 结果为True说明存在重复值,需要进行处理 异常值处理看看票价是否存在异常值我们发现票价存在明显的异常值,这里我们需要剔除出票价大于300的原创 2022-06-17 08:30:00 · 11394 阅读 · 37 评论 -
数据分析案例-停车场数据可视化分析
数据为某停车场信息表,具体字段信息如下表:字段含义字段含义cn车牌号price停车所交费用timein车辆进场时间state是否已经离场timeout车辆出场时间rps当前空余车位数量 部分数据展示首先,导入本次项目用到的第三方包以及数据这里我们需要得到每一条车辆出和入时间的差值并且结果要转化为小时数,然后根据小时数进行分类标签 (这里如果要求的是天数,只需要把h改为D即可)这里我们需要根据车辆入的时间提取出小时数并做统计 这里我们需要用到日期类型的内置函数weekday得到星期数(1-原创 2022-06-15 21:47:44 · 10900 阅读 · 14 评论 -
数据分析案例-电影数据可视化分析
数据介绍数据为2011-2021电影数据可视化分析首先导入本次项目需要的包和数据数据预处理 可视化原创 2022-06-12 09:58:54 · 27667 阅读 · 246 评论 -
数据分析案例-数据可视化
数据介绍数据为2022年东奥会奖牌榜数据首先导入本次项目用的包和数据原创 2022-06-12 09:36:08 · 8827 阅读 · 4 评论 -
pyecharts绘制条形图、饼图、散点图、词云图、地图等常用图形
目录PyEcharts 简介Bar图Line图Pie图Scatter图Boxplot图heatmap图Kline图funne图WordCloud图Radar图Map图组合图Timeline图PyEcharts 简介Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众 多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇 上数据可视化时,pyechar...原创 2022-05-02 08:00:00 · 14694 阅读 · 7 评论 -
seaborn画直方图、条形图、盒图、散点图等常用图形
目录简介distplot 直方图barplot条形图boxplot 盒图小提琴图stripplot(分布散点图)swarmplot(分簇散点图)scatterplot散点图kdeplot双轴密度图pointplot点图heatmap热力图pairplot散布图矩阵lineplot线型图回归分析图简介Seaborn 是以 matplotlib为底层,更容易定制化作图的Python库。Seaborn其实是在matplotlib的基...原创 2022-05-01 09:48:44 · 9753 阅读 · 4 评论 -
matplotlib画折线图、直方图、饼图、散点图等常见图形
Matplotlib简介Matplotlib 是一个 Python 的 2D绘图库。通过 Matplotlib,开发者 可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形 图,错误图,散点图等。置中文标题Matplotlib 默认情况不支持中文,我们可以使用以下简单的方法来 解决:plt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签折线图from matplotlib import pyplot as plt#准原创 2022-04-30 23:18:00 · 12416 阅读 · 0 评论