
数据可视化
文章平均质量分 87
刘早起
微信搜索【早起Python】关注我的公众号
关注后回复以下关键词获得不同学习资源:
1、回复pandas,获得pandas120题
2、回复Python,获得Python技术图书
3、回复爬虫,查看爬虫系列文章
4、回复自动化,查看自动化系列文章
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
再见 Notebook?数据科学家专属 IDE?DataSpell初体验!
不论是代码检查、异常调试、版本控制、项目管理、远程开发等标准化开发功能,都是一个程序员需要具备的技能,而在这之前我见到的一些数据分析、机器学习相关人员,大多只是会数据、算法本身的工作,对于工具却比较薄弱。另外,由于功能复杂,真正能用于写代码的区域很小(虽然可以折叠),如果你是笔记本电脑,那么可能一个页面只能容纳下2-3个单元格,用起来比较鸡肋。这种让你少写几行代码的快捷操作,在代码开发阶段还是比较舒服的,毕竟有时候一些简单的操作需要写很长的代码。文件,若要是项目关联的文件比较多,可能急需要打开一排窗口。原创 2022-10-05 11:46:47 · 6287 阅读 · 6 评论 -
一个小破网站,比Pandas官网还好用?
大家好,我是早起。在去年九月,我将Pandas120题升级到Pandas300题,意外的收获了很多好评,到目前总下载量有数千次。伴随着刷题人数越来越多,很多粉丝问我能否提供一份查询版,让答案附在习题下面,就像这样????但整理出来之后发现使用反馈并不是很好,偶尔想查询一些小的操作都需要先启动Jupyter Notebook,再点开多层文件夹才能找到,十分繁琐。此外,相信大家在搜索部分pandas操作时,并不难找到相关的帖子或者教程,但是在阅读这些文章时会有一个体验即看上去很过瘾,自己一.原创 2022-01-08 14:29:54 · 6889 阅读 · 2 评论 -
Python + Steamlit 快速开发可视化 web 页面!
用Python做web图形用户界面,最先想到的是Flask、Djong等框架。然而研究这些对于初学者来讲,尤其是没有web开发基础的数据分析人员是痛苦的。幸运的是,Python中也有很多第三方库来快速进行简单的web可视化,例如之前介绍的 PyWebIO今天再介绍一个 Steamlit,可以快速利用简单的代码快速布局自己想要的web界面!一、安装与运行安装之前,我们需要将 Python 的版本升级到3.7或以上,同时设置好环境变量,这里默认读者都已经设置好不细讲。在 Windows.原创 2021-10-25 11:19:47 · 6171 阅读 · 0 评论 -
总结了10个matplotlib绘图技巧,短小精悍,威力无穷!
大家好,我是早起。在使用 Python 进行数据可视化时,相信不论是什么工具,你都会发现有些操作/代码段会频繁的用到,这一点在matplotlib上尤为突出,本文就向大家分享十个我常用的一些小技巧,大多一行代码,短小精悍,威力无穷。一、快速且正确的显示中文在matplotlib中,默认是没法显示中文的,原因很简单,默认使用的字体文件中不含中文。当你搜索如何设置中文时,会有很多教程,我曾经也详细的介绍过3种方法,但是在有的电脑上折腾很久也搞不定,所以当你浪费了太多时间也没法解决,或者在一台陌生原创 2021-03-29 15:31:21 · 836 阅读 · 0 评论 -
用Python制作一个数据预处理小工具,多种操作,一键完成,非常实用!
在我们平常使用Python进行数据处理与分析时,在import完一大堆库之后,就是对数据进行预览,查看数据是否出现了缺失值、重复值等异常情况,并进行处理。本文将结合GUI工具PySimpleGUI,来讲解如何制作一款属于自己的数据预处理小工具,让这个过程也能够自动化!最终效果如下本文将分为三部分讲解: 制作GUI界面 数据处理讲解 打包与测试 主要涉及将涉及以下模块: PySimpleGUI pandas matplotlib 一、GU原创 2021-02-06 09:52:17 · 1400 阅读 · 2 评论 -
matplotlib进阶必会!使用OffsetBox尽情的添加你想要的自定义元素!
大家好,我是早起。我们都知道,如果想要在matplotlib中添加文字注释可以使用plt.text根据坐标来添加,如果想要添加箭头也同样可以使用plt.arrow根据坐标完成。那如果想要添加自定义的图片呢?在matplotlib中添加自定义图片有多种方法,本文将基于matplotlib中的Artists容器类讲解,如何在我们制作的图中添加任意自已想要的元素。作为示例,和以前的文章一样,本文不罗列各种参数,用下图作为示例,step by step的介绍每部分制作流程 一句话看懂原理关于原创 2021-01-23 09:29:44 · 1855 阅读 · 0 评论 -
Matplotlib官方神图,被我画出来了!
大家好,在之前的文章人人都能看懂的Matplotlib绘图原理中,我们对Matplotlib的绘图机制进行了讲解,在弄清楚plt.xxxx和ax.xxxx中plt和ax区别之后,本文继续讲解xxxx究竟是什么。现在我们应该知道Matplotlib绘图其实很简单,不就是弄一块画布,然后往这块画布上添加我们要的图形,最后就是进行修饰。如何添加画布/绘图区域已经讲过,如何添加图形,看我发的各种可视化图鉴就行了,而最需要花时间的就是对初步成型的图案进行修饰,先来看一张来自官方文档的图 我们可以看到,其实原创 2021-01-18 09:27:44 · 827 阅读 · 1 评论 -
人人都能看懂的Matplotlib绘图原理
前言大家好,我是早起,这篇文章没有代码,只做一件事:尝试讲明白Matplotlib的工作机制,先说说我刚开始是怎样学习Matplotlib的吧(可能也是你的)????大概在几年前,我还是一个Excel Boy,在学习了一段时间Python后,发现用Matplotlib居然也能制作精美的图形,于是百度【Matplotlib怎么制作xx图】,之后随便点开一两个网站,跳过大段文字部分,直接复制代码粘贴运行,成功得到图片。OK!Matplotlib我会了!**这样学不行吗?当然行!**我在之前文章中也说原创 2021-01-17 08:28:25 · 646 阅读 · 0 评论 -
Python爬取上万条大众点评数据,解读一线快餐品牌背后的秘密
中国的快餐市场竞争一直都很激烈,关于各种品牌江湖上也流传着各种神奇的故事,那么你知道 一线城市最多的快餐品牌是哪家? 沙县小吃真的是中国餐饮巨头吗? 每一家肯德基边上都有一家麦当劳是不是真的? 星巴克VS瑞幸咖啡,谁的热度更高? 本文使用Python爬取了上万条大众点评商家数据,告诉你答案!一线城市快餐品牌店铺数量大PK首先我们来看一下一线城市中沙县小吃、兰州拉面、星巴克、瑞幸咖啡、肯德基、麦当劳的店铺数量分布情况 从上方的图中可以看到,沙县小吃在上海、广原创 2020-12-25 13:15:37 · 1053 阅读 · 2 评论 -
圣诞节,教你用Python给微信头像添加一个圣诞帽~
大家好,我是早起。圣诞节快到了,每年一到圣诞节就会有很多人的头像上多了一顶小红帽 那么你有想过如何用Python去实现吗?如果你尝试去搜索,会发现网上教程一大堆,但是由于大多数人都将圣诞帽位置固定了,所以放上自己的图片后,要不就是圣诞帽偏移了,要不就是帽子比头还大,代码也不知道在哪里改,无从下手。因此,本文将手把手教你如何用Python为你的微信头像添加一顶圣诞帽,并结合我们之前讲过PySimpleGUI,做成一个带有GUI的小程序,先看效果: 本次主要分为两个部分讲解: 用ope原创 2020-12-24 11:58:52 · 630 阅读 · 3 评论 -
尝鲜!微软首个AI量化投资开源平台Qlib上手体验!
近日,微软亚洲研究院正式发布了业内首个AI量化投资开源平台Qlib,发布一个月以来已经在GitHub收获2.3k star! 值得关注的一点就是这套量化系统的框架分为多层,每层由多个松散耦合的模块组成,因此每个模块用户都可以自行修改、定制、使用,如下图所示 通过这样的方式,可以让用户更快的了解整个工作流程,并灵活的进行调整,同时也支持在线和离线两种模式,嗯,本地取数据、本地跑策略,隐私上也有一定的提升。更多的宣传点,本文不再过多介绍,下面将从用户使用的角度讲解如何安装配置Qlib并构建一个量化交原创 2020-12-17 22:04:45 · 4449 阅读 · 11 评论 -
天秀!一张图就能彻底搞定Pandas!
大家好,在三月初,我曾给大家分享过一份Matplotlib绘图小抄,详见收下这份来自GitHub的神器,一图搞定Matplotlib!昨天在面向GitHub编程时,无意发现了Pandas官方竟提供了同款小抄,项目地址如下https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf可以看到这份小抄提供了PPT和PDF两个版本,虽然最新一条更新记录为两年前,但是并不影响我们拿来学习,下原创 2020-12-07 10:06:11 · 716 阅读 · 2 评论 -
PySimpleGUI 进阶| 原来用Python做一个图片查看系统,还能这么简单!
大家好,在昨天的文章中我们已经介绍了为什么以及如何基本使用PySimpleGUI,并且对一些比较常用的元素(element)也有所了解。本文将对基础版中的一些元素与新讲解的元素进行组合,构建一个图片查看系统与一个简易的计算机视觉系统(代码调用前置照相机)作为PySimpleGUI的进阶篇,我将分为以下两个部分讲解: 图片查看系统的构建 简易计算机视觉系统(cv)的构建 本次内容主要涉及的Python模块: PySimpleGUI os cv2 图原创 2020-11-29 10:51:24 · 2221 阅读 · 2 评论 -
8 个 Jupyter Notebook 小技巧,隐藏得太深了!
如果你想用Python进行数据分析,那么Jupyter notebook是你必须要熟练掌握的工具之一,而Notebook也有很多省时好用的小技巧,本文将分享我在使用Notebook时习惯使用的一些操作! 1.在Notebook中安装第三方库有时我们在进行数据分析的过程中,或者是使用一些在线/远程Notebook,需要临时安装一个第三方库,如果从命令行(甚至没有命令行界面)安装后再重启notebook,那么所有进度都将丢失!这时我们可以使用!pip install xxx 就可以直接在no...原创 2020-11-24 11:58:42 · 1445 阅读 · 0 评论 -
【Python数据可视化】用Pandas做出精美图表
如果你经常使用Python进行数据分析,那么对于Pandas一定不会陌生,但是Pandas除了在数据处理上大放异彩,随着版本的不断更新,Pandas的绘图功能在某些情况下甚至要比Matplotlib更加适用,本文就将介绍如何用Pandas更快的进行数据可视化!基本使用,学会制作套路首先我们使用pandas随机生成示例数据import pandas as pddf= pd.DataFrame(np.random.rand(8, 4), columns=['A','B','C','D'])现在只要原创 2020-11-22 10:27:44 · 2240 阅读 · 5 评论 -
pivottablejs|在Jupyter中尽情使用数据透视表!
大家好,在之前的很多介绍pandas与Excel的文章中,我们说过**「数据透视表」是Excel完胜**pandas的一项功能。Excel下只需要选中数据—>点击插入—>数据透视表即可生成,并且支持字段的拖取实现不同的透视表,非常方便,比如某招聘数据制作地址、学历、薪资的透视表而在Pandas中制作数据透视表可以使用pivot_table函数,例如同样制作上面的透视表可以使用下面的代码pd.pivot_table(df,index=["地址","学历"],values=["薪资水平"])原创 2020-10-28 08:03:15 · 2153 阅读 · 0 评论 -
如何在启动Jupyter Notebook时自动执行一段代码?
在我们使用Jupyter Notebook写代码时,启动后总是需要导入一些库并进配置,尤其是用来做数据分析时,打开后肯定是光速键入下面的代码import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import svm, tree, linear_model, neighbors, naive_bayes, ensemble, discriminant_analysis, gaussian_p原创 2020-10-10 09:28:37 · 3123 阅读 · 1 评论 -
分析数万条旅游评论数据后,告诉你国庆“坑爹”景点背后的秘密......
大家好,说一个鬼故事:你的假期余额不足4小时,这个国庆,你出去旅游了吗?每次假期后网友总爱去微博、知乎吐槽国庆旅游的坑爹景点,相关话题也频上热榜,在国庆期间也有相关文章**[1]通过整理对应话题统计出最坑爹城市前五名分别为杭州、西安、厦门、北京、南京**,而最坑爹景点则有西湖、兵马俑、鼓浪屿、故宫、夫子庙、黄鹤楼等**[2]**,本文通过Python爬取旅游网站评论数据,分析这些城市和景点在国庆期间到底表现如何,是否真的像网友吐槽的那样坑爹。01数据来源与说明本文使用的数据均来源于携程旅行官网对应景点原创 2020-10-08 22:07:09 · 582 阅读 · 1 评论 -
来自Kaggle金牌得主的Python数据挖掘框架,一文学会机器学习基本流程!
导读很多同学在学习机器学习时往往掉进了不停看书、刷视频的,但缺少实际项目训练的坑,有时想去练习却又找不到一个足够完整的教程,本项目翻译自kaggle入门项目Titanic金牌获得者的Kernel,该篇文章通过大家并不陌生的泰坦尼克数据集详细的介绍了如何分析问题、数据预处理、建立模型、特征选择、模型评估与改进,是一份不可多得的优秀教程。本文在翻译的同时删减了部分介绍性文字,并对结构进行了调整方便大家阅读,由于篇幅原因,本篇文章中并没有包含大段的代码,仅保留过程与结果。建议在文末获取Notebook版本原创 2020-09-23 13:58:48 · 580 阅读 · 0 评论 -
腾讯微博即将退出舞台,爬取近十年腾讯微博数据,发现转折点竟在这一年!
前言你用过腾讯微博吗?9月4日,腾讯微博团队突然发布公告称,将于9月28日停止服务和运营,此条消息一出,新浪微博立马安排了一条热搜并引发网友热议!部分用户很震惊腾讯微博居然关了,也有些用户很震惊腾讯微博居然还活着,还有部分用户甚至不知道腾讯微博的存在,腾讯微博已经被淹没在互联网的长流中,但互联网是有记忆的,本文就将通过Python爬取历史数据,尝试探索背靠数亿流量的腾讯微博是如何一步步退出舞台。为了研究腾讯微博的历史数据,很自然的就想到从网页入手,但是让人遗憾的是,虽然官方公告说9月28日正式停止运原创 2020-09-12 11:18:34 · 1948 阅读 · 0 评论 -
NumPy进阶80题完整版|附Notebook版本下载
前言大家好,NumPy进阶修改80题现在已经全部更新完毕,80道习题涵盖了NumPy中数组创建、访问、筛选、修改、计算等常用操作,如果不熟悉NumPy的读者可以刷一遍,因为里面的代码大多拿走就能用,所以如果你已经了解NumPy的基本操作,我更建议将这80题当成速查手册使用,随用随查!本文共分为两个部分:完整版NumPy80题Notebook版下载方式完整版80题1.导入并查看NumPy版本import numpy as npprint(np.__version__)1.15.42.原创 2020-07-22 10:14:49 · 1126 阅读 · 0 评论 -
可视化工具不知道怎么选?深度评测5大Python数据可视化工具
相信很多读者学习Python就是希望作出各种酷炫的可视化图表,当然你一定会听说过Matplotlib、Pyecharts、Seaborn、Plotly、Bokeh这五大工具,本文就将通过真实绘图来深度评测这五个Python数据可视化的库,看看到底这几种工具各有什么优缺点,在制作图表时该如何选择。指标说明为了更清晰的了解这几款用于可视化的Python在作图时的异同,本文将使用同一组数据分别制作多系列条形图来对比,主要将通过以下几个指标来进行评测:数据说明本文使用的数据为Pyecharts中的fak原创 2020-07-14 10:45:42 · 1194 阅读 · 1 评论