自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AwesomeTang

在职数据分析师一枚,有任何问题欢迎添加微信:kinnnnngjames(备注优快云),也欢迎关注我的公众号AwesomeTang~

  • 博客(138)
  • 资源 (1)
  • 收藏
  • 关注

原创 【Pyecharts|GEO】Pyecharts实现微博签到中国/Pyecharts中使用scatterGL详解

前言之前在【Pyecharts Gallery】中看不中用的可视化作品集合~发布过一个可视化作品——微博签到中国,不过当时存在一个比较严重的问题,数据加载太慢了,图表中总共包含了30W+个点,渲染完所有的点都得一两分钟,在图例筛选上也存在非常严重的卡顿,用户体验实在太差,最近得空又重新研究捣鼓了下,终于解决了,这次也尽可能详细的讲解下我的解决办法;Echarts在17年发布了GL,对于量级较大的数据支持性能上有了质的提升,所以理论上我们只要GEO-Scatter图表更换成GEO-scatter

2021-01-23 22:56:37 1403 2

原创 【Python爬虫】爬取英雄联盟所有皮肤图片实现千图成像~

前文本文主要分为两个部分一部分是爬虫,这边是选择爬取英雄联盟官网英雄资料中的英雄皮肤图片,如下为新英雄seraphine的页面,包含英雄对应的所有皮肤;另一部分是图片的合成,先将所有英雄皮肤图片拼接成为一张图作为背景,然后与另一张图片进行合成,效果如下:爬虫思路整理F12打开控制台后刷新页面(https://lol.qq.com/data/info-defail.shtml?id=147),既然是找图片,直接在img标签下找就好了;获取到图片的地址之后(https://game.g

2020-11-08 00:32:09 5589 15

原创 【爬虫教程】吐血整理,最详细的爬虫入门教程~

初识爬虫学习爬虫之前,我们首先得了解什么是爬虫。来自于百度百科的解释:网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。通俗来讲,假如你需要互联网上的信息,如商品价格,图片视频资源等,但你又不想或者不能自己一个一个自己去打开网页收集,这时候你便写了一个程序,让程序按照你指定好的规则去互联网上收...

2019-12-02 21:06:08 6478 6

原创 Pyecharts系列课程07——饼图(Pie)

与标签设置类似,我们也可以通过来设置悬浮提示框的显示内容。'''简单示例'''# 示例数据# 新建一个饼图# 添加数据chart.add(series_name="销量",# 设置标签的显示内容# 在Jupyter中加载图表。

2025-02-19 20:09:05 50

原创 【SQL教程|07】sql中条件查询where用法示例

语句后过滤结果集,只返回符合条件的记录。结果:返回部门为’Sales’或’Marketing’的员工.结果:返回部门是’Sales’或’Marketing’的员工.结果:分别返回年龄大于等于28岁和小于等于30岁的员工.结果:分别返回年龄大于25岁和小于35岁的员工.结果:返回名字包含’Alice’前缀的员工.筛选大于或等于、小于或等于特定数值的记录。结果:返回年龄在25岁到30岁之间的员工.结果:返回所有年龄不为30岁的员工.结果:返回所有年龄大于25岁的员工.结果:返回年龄为28岁的员工。

2025-02-18 20:08:02 721

原创 Pyecharts系列课程06——热力图(Heatmap)

上一节在散点图我们使用到了视觉组件,在热力图中视觉组件也是非常重要的配置部分,这次我们学习设置数据值分段映射。# 新建图表# 添加数据chart.add_yaxis(series_name="访问用户数", yaxis_data=hours, value=viewers)# is_piecewise需设置为Truepieces=["max": 20},"min": 20,"max": 50},# 当数值介于50到99之间时设置为金色"min": 50,"max": 99,},

2025-02-18 20:01:23 109

原创 【SQL教程|06】sql中order by用法示例

ORDER BY是SQL中强大的排序函数,用于按指定顺序排列查询结果。理解其语法、使用场景和注意事项,有助于有效提升数据处理效率。通过结合GROUP BY、多个字段排序及与其他关键字的使用,可以实现更为复杂的分析需求。

2025-02-10 20:43:15 730

原创 Pyecharts系列课程05——散点图(Scatter)

本章我们学习Pyecharts中散点图的实现方法,散点图通常用于观察数据的分布和相关性。

2025-02-09 18:16:25 395

原创 【Pandas | 06】数据转换篇「astype, split,split,to_datetime」

数据分析中,数据的转换是非常重要的一步。无论是字符串操作、时间格式处理、类别型数据处理还是排序与重新索引,这些技能都能帮助我们更好地整理和准备数据,使其更符合分析需求。在数据分析中,我们经常需要将字符串型数据(如类别或标识符)转换为数值型数据以便进行数学运算或统计分析。在这一章节中,我们将详细介绍如何使用Pandas进行这些常见的数据转换操作,并通过实际示例说明每种操作的应用场景和方法。有时候我们需要将数值型数据转换为字符串格式,例如进行拼接、合并或者其他字符串操作。字符串操作是处理文本型数据的基础。

2025-02-09 14:48:58 33

原创 【Pandas | 00】概述——认识Pandas

Pandas是数据科学家的瑞士军刀,提供了一整套处理结构化数据的强大工具。掌握Pandas不仅能提升数据分析效率,还能为学习其他高级工具打下基础。通过以上内容,你可以对Pandas有一个全面的了解,并开始实践使用!接下来可以尝试自己动手完成一些小项目或练习题来巩固所学知识。

2025-02-09 10:02:04 39

原创 Mac系统本地化部署DeepSeek+ChatBox教程

参数量直接影响模型的性能、资源需求和适用场景。在新建对话后我们可以点击标题位置,为此对话设置一个对话的背景,比如:“版本模型文件大小为4.7GB,整个下载时间会比较长,耐心等待即可。”,那么此对话的回答都会建立在这个背景下去进行。在命令行中对话多有不便,我们可以通过安装。DeepSeek的不同模型版本(如。下载安装包,下载后直接安装即可。,输出如下版本即表示安装成功。对于我们个人电脑,我们选择。得到一个图形化界面来使用。

2025-02-09 01:09:54 4317

原创 【进度条实现】Python中tqdm使用示例

是 Python 中一个非常流行的进度条库,可以快速为循环或长时间运行的任务添加进度提示。通过上述方法,你可以轻松为 Python 任务添加直观的进度提示!处理多层循环时,可以嵌套使用。

2025-02-07 19:01:09 491

原创 【SQL教程|05】Mysql中Limit用法详解

子句用于限制查询结果返回的行数,常用于分页查询或仅获取部分数据。,可以高效控制查询结果规模,尤其适合分页、抽样、排行榜等场景!如果不指定排序,结果顺序可能不稳定,导致分页数据重复或遗漏。在去重或分组后生效,可能返回少于预期的行数。在大偏移量时性能较差(如。对于大数据表,避免使用。在 MySQL 中,

2025-02-07 18:59:05 570

原创 Pyecharts系列课程04——折线图/面积图(Line)

本章我们学习在Pyecharts中折线图(Line)的使用。折线图通用应用于数据的趋势分析。

2025-02-06 21:40:27 763

原创 Pyecharts系列课程03——直方图(Bar)

本章我们学习在Pyecharts中(Bar)的使用。直方图通用应用于表现不同类别数据的的对比分析。

2025-01-19 17:22:46 961

原创 Pyecharts系列课程02——Pyecharts图表类型和配置项

在Pyecharts提了丰富的API,便于用户能够快速上手,轻松完成图表绘制。在我们真正开始实战之前我们需要先了解两个部分。

2025-01-19 14:08:39 530

原创 Pyecharts系列课程01——认识Pyecharts

是一个基于的开发的Python数据图表库,它允许用户使用Python语言生成各种类型的交互式图表。相较于matplotlib的学术风格,Pyecharts的交互性在企业中通常拥有更广泛的应用场景,也是我们数据分析师/业务分析师岗位的同学必须学习了解的Python库之一。

2025-01-18 17:55:06 297

原创 【SQL教程|01】SQL简介——什么是SQL

SQL是一门用来操作数据库系统的语言,但我们熟知的数据库其实很多种,比如常见的Mysql,Oracle,SQLServer,近几年比较火热的clickhouse,doris DB等等。不同的数据库系统可以应用不同的使用场景,但这样也就造成了,虽然都是SQL语言,但也会存在很多不同的版本。但好在现有SQL都会去遵循ANSI 89的标准(ANSI, 美国国家标准化组织),能够保证基本命令(,,,,等等)的用法都是一致的,这也保证了我们数据从业人员在不同数据库系统之间迁移的学习成本不会太高。当然除了SQL的标准

2022-12-03 15:47:57 1448

原创 【Pyecharts|GEO-Lines】全球航线图的绘制

基于Pyecharts生成全球航司航线图。

2022-10-15 16:11:41 2377

原创 【Seaborn】组合图表:PairPlot和JointPlot

会自动根据数据集中的度量字段自动生成图表,而不需要我们依次去绑定数据;默认对角线是使用直方图,两侧散点图;如一样,一样也会根据数据集的度量字段自动生成图表,而不需要依次去指定;...

2022-06-04 10:46:22 1226 1

原创 【Seaborn】组合图表:FacetGrid、JointGrid、PairGrid

Seaborn中有几种特殊的组合图表:、、,不同于我们在上一章讲到的组合图表,这三种组合图表是Seaborn中根据我们常用的统计场景已经将图表组合封装好了,我们只需要简单的绑定我们的数据即可完成绘制。会根据我们数据集中的维度字段快速的将一份图表复制多份。是根据数据集的维度去创建多个图表的话,那么就是根据数据集中的度量字段去生成多个坐标系;我们同样还是使用相同的数据集:我们也可以通过和分别去指定对角线的图表和非对角线的图表;如下所示,我们指定对角线的4个图表使用,非对角线的图表使用;你会发现这样对

2022-06-03 17:20:39 539

原创 【Seaborn】组合图表、多子图的实现

介绍seaborn可以非常便捷的将各种图表组合起来,如在上一章使用row和col参数可以非常快速的根据数据生成多个图表;本章主要介绍根据我们自己的个性需求生成组合图表,这里组合图表分成两种形式:多子图:在一个画布上绘制多个坐标系;图表重叠:将多个图表在一个坐标系展示;多子图在之前的内容中我们讲到了seaborn的图表层级,axes-level图表是可以添加到matplotlib的复杂figure中的,seaborn中的axes-level都有添加一个ax参数用于指定在figure中的绘图位置

2022-05-28 16:06:06 2820

原创 【Seaborn】Seaborn中的三类图表——相关性(relplot)、分布型(displot)和分类型(catplot)图表

介绍本章主要介绍在Seaborn中的三种图表类型:相关性图表(relplot)分布型图表(displot)分类型图表(catplot)相关性图表相关性图表主要是散点图和折线图,散点图用于相关性分析相比大家都会比较熟悉,seaborn中的线图主要是用于连续性数值的分析;在上一章的内容中提到过,seaborn有figure-level和axes-levle层级的两种图表,在相关性分析的图表中我们通常会使用relplot,relplot是figure-level的图表,散点图和线图我们可以通

2022-05-22 17:07:17 1899

原创 【Seaborn】初识Searborn

初识SearbonSeaborn是一个基于Matplotlib编写的可视化图形库,也能快速支持Pandas、numpy的数据结构;相较于Matplotlib90年代的绘图风格以及复杂的API,Seaborn可以更加快速便捷的绘制出更加复杂更加好看的可视化图表;就像seaborn的官方文档说的,希望通过Seaborn能够可以让你更加专注于数据本身,而不是如何去绘制整个图表;第一个例子# 引入seaborn和matplotlibimport seaborn as snsimpor

2022-05-21 15:55:06 600

原创 【Matplotlib】多子图&不均匀分布子图|subplot、subplots和add_subplot的用法

介绍本站主要介绍如何在画布(figure)中常见多个图表(axes);均匀分布子图不均匀分布子图简单例子import matplotlib.pyplot as pltplt.style.use(['ggplot']) # 设置图表风格plt.rcParams['font.sans-serif'] = ['Heiti TC']x = ["深圳", "广州", "北京", "上海"]y = [1, 3, 2, 5]ax1 = plt.subplot(2, 2, 1)ax1.ba

2022-05-21 11:26:27 1184

原创 【Matplotlib】图表元素

介绍本章主要介绍在Matplotlib中的图表元素添加与配置方法,包含:画布大小标题坐标轴标题图例数据标签网格线等等基础例子在后续的例子都会基于下面这个折线图去进行配置:import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['Heiti TC']x = ['1月', '2月', '3月', '4月', '5月', '6月', '7月', '8月', '9月', '10月', '11月', '12月

2022-05-15 15:26:32 408

原创 【Maplotlib】基础图表介绍

基础图表本章内容主要在Matplotlib的基础图表。折线图折线图通常用于展示一段时间内的趋势,可以通过plot()进行折线图的绘制;import matplotlib.pyplot as plt# 设置中文字体plt.rcParams['font.sans-serif'] = ['Heiti TC']plt.plot( ["深圳", "广州", "北京", "上海"], [1, 4, 2, 3], linestyle='-.', # 线型 linewid

2022-05-08 18:05:36 610

原创 【Matplotlib】关于Matplotlib需要理解的知识&解决中文方块问题

介绍Matplotlib可以说是Python可视化领域的泰斗,如果你想学习Python可视化,那么Matplotlib肯定是没办法绕过去的。Matplotlib 是 Python 的绘图库,它能让使用者很轻松地将数据图形化,并且提供多样化的输出格式。Matplotlib 可以用来绘制各种静态,动态,交互式的图表,我们熟知的Seaborn,Pandas的绘图接口也是基于Matplotlib做了更高级的封装。Matplotlib 是一个非常强大的 Python 画图工具,我们可以使用该工具将很多数据

2022-05-08 14:05:31 440

原创 【爬虫+可视化】爬取S11期间EDG百度指数变化形成可视化图表

前言文章分为两个部分:爬虫&可视化爬虫根据关键词获取百度指数的数据,百度指数官网:https://index.baidu.com/我们打开F12打开控制台之后,在百度指数页面随便搜一个关键词,就可以在后台中轻易的找到请求:定睛一看,发现事情没那么简单:首先百度接口返回来的数据明显是经过加密的,所以想用的话,还必须得之后怎么去进行解密接着我们便通过关键词decrypt去页面中调用的js文件中进行查找,然后就找到了这么一个方法:看起来是像是用来解密的,需要两个参数,我们便可以大胆的

2021-11-13 13:52:09 1878

原创 【Pyecharts | Timeline】美国疫情蔓延趋势图(自动轮播)

实现效果根据时间趋势更新每日疫情信息;首先我们可以对整个可视化作品进行一个拆分:要在Pyecharts中实现自动轮播的话,首先他会包含一个Timeline组件; 其次可以看到,在每天的图像中是由一个Bar和一个Map组合而成的; 那么如何将Bar和Map组合起来呢?通过Grid就可以完成;整体结构示意图如下:接下来我们从简单的开始,首先来实现Bar先看代码:t = [['North Carolina', 1008036], ['New Jersey', 10

2021-11-06 15:03:27 842

原创 【datashader】使用datashader完成大型地理空间数据可视化

前言这篇文章来源于datashader一个官方的示例,原文地址https://examples.pyviz.org/census/census.html,这个notebook算是将其复现了一下(有些小改动);数据集可以访问https://www.heywhale.com/mw/dataset/61569b59b97cc600181fe0c1/file进行下载。整个项目依赖模块较多,而且对于版本有些限制,可以参考我的环境信息:模块导入import datashader as dsimport

2021-10-03 16:17:37 1531 1

原创 【Pyecharts | Map3D】带光影效果的3D地图 | 深圳地区二手房房价地图~

效果先看看最终实现的效果:通过Pyecharts做的一个3D地图,用户展现深圳各个小区的平均房价数据,数据是来自于和鲸社区。分步讲解模块引入import pandas as pdfrom pyecharts.charts import *from pyecharts import options as optsfrom pyecharts.commons.utils import JsCode数据处理# 读取数据,编码指定为GBKdf = pd.read_csv('/home/

2021-09-25 20:11:51 1127

原创 【配色方案】可视化图表不知道怎么配色,来参考下顶尖公司的Logo配色方案~~

前言不知道大家有没有这种感觉,一个可视化图表做的好不好看,基本都取决于图表的配色,虽然当前的一些流行的可视化框架、工具,如Echarts,tableau等等,都提供了不错的配色方案,但看得多了也难免会审美疲劳,所以如果想做一个让人眼前一亮的图表,还是需要我们自己在配色上下点功夫。可是对于很多没有艺术细胞的理工男,程序员,要设计出一款不错的配色方案的概率基本等于瞎猫碰上死耗子。那该如何设计出一款不错的配色呢?今天就来给大家提供一种思路——使用顶级公司Logo的配色方案~本文将会整理17个公

2021-08-22 14:37:21 1921

原创 【Pyecharts | Line】2020年中国奥运会夺金记录!

前言通过时间线展示中国代表队每个金牌的获奖选手和项目名称;截止文章发布的时间,目前中国队获得22枚金牌,位列奖牌榜第一位;话不多说,我们先来看下最终实现的效果:有多少人能看出来这是通过折线图(Line)来实现的~实现细节数据来源首先奖牌数据是通过咪咕视频的接口数据获取的。咪咕视频夺金时刻页面:直接通过后台接口请求即可,没有碰到什么反爬虫措施,获取的数据是Json,为方便后期处理,通过Pandas转为DataFrame,代码如下:import request.

2021-08-01 13:49:59 943

原创 【2020东京奥运会】奥运榜单以及各国参赛运动员数据可视化~

奖牌榜数据通过咪咕视频的接口获取奖牌榜单的数据,貌似也没做什么反爬虫,直接就可以获取到数据:import requests rank_url = 'https://app-sc.miguvideo.com/vms-livedata/olympic-medal/total-table/15/110000004609'data = requests.get(rank_url).json()数据处理,将json数据转化为dataframe:df = pd.DataFrame()for

2021-08-01 09:57:46 13791 5

原创 关于Youtube榜单数据的探索,排名第一的视频播放次数已接近90亿次!

数据来源数据来源于维基百科——List_of_most-viewed_YouTube_videos,数据统计截止时间在2021年7月份左右(不同榜单时间会有不一样)。没有梯子的同学可以去https://www.heywhale.com自取。最多播放的视频排名第一的是一首儿歌,总播放次数达到了近90亿次播放,平均每个地球人播放了1.5次,恐怖如斯。 在榜的视频大多都是MV,其中Ed Sheeran,Maroon5,Katy Perry多次上榜;在榜时间最长的视频榜单明细:柱状图

2021-07-18 18:46:13 5056 2

原创 【plotly+ datashader+mapbox】Uber纽约上车点可视化/解决超大量地理数据可视化

前言大部分时间我都是使用Pyecharts去做可视化,不过一直有个比较头疼的问题没法解决。在pyecharts中是需要把所有的坐标点的数据加载到图表中,当数据量特别大的时候,那么这样一个图表可能会有好几百MB,使用起来会非常卡顿。虽然在Echarts中有ScatterGL来支持大数据量大可视化,不过在Pyecharts中没法直接支持,只能找一些曲线救国的方法,改善效果也不是很明显。最近使用了一下plotly,发现了超大地理数据集可视化的解决办法,我们先来看下效果:数据总共包含100W个数

2021-07-11 18:03:55 1158 1

原创 【PyG2Plot】来试一下蚂蚁开源的图表库PyG2Plot效果如何~~

前言???? PyG2Plot 是 @AntV/G2Plot 在 Python3 上的封装。 G2Plot 是一套简单、易用、并具备一定扩展能力和组合能力的统计图表库,基于图形语法理论搭建而成。G2Plot是蚂蚁开源的一款可视化图标库,官方地址:https://antv-g2plot.gitee.io/zh ,因为PyG2Plot没做什么二次开发,所以文档直接看G2Plot的文档就行;...

2021-07-04 17:14:26 1509 2

原创 【Pyecharts | PictorialBar】StockX球鞋溢价排行TOP10~

前言效果展示:图表使用了Pyecharts中的象形图(PictorialBar) ,虽然是一组数据,其实是包含了两个系列:“山”样式的象形图展示数据 通过象形图展示球鞋的图片来替代坐标轴标签关键代码上文说到了,其实整个图表是通过两个系列的数据组合来完成,接下来我们将整个图表进行解耦,分开进行说明:坐标轴标签首先说明一下,在象形图中我们是可以通过图片来作为symbol的,在本项目中球鞋的图片都是来自于StockX网站,不过StockX获取的图片都是白底的,如下样式:当把

2021-07-03 12:46:20 476

原创 【Pyecharts | TreeMap】中国各省市拥有高校数量对比图~

前言效果如下,使用了Pyecharts中的TreeMap实现,可以通过点击下钻到各个省市查看高效数量~关键代码数据格式首先使用TreeMap我们得按照格式将数据准备好。TreeMap所需的数据格式如下:data = [ {"name": "湖南", "itemStyle": {"color": "#da0d68"}, "children": [ {"name": "长沙", "value

2021-06-19 17:15:42 688

Pyecharts50个例子

光有数据不会展现也是枉然,50个pyecharts完整实例,从易到难,循序渐进,带你打开数据可视化大门~

2020-11-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除