目录
Python 简介
Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。
Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。
Python 是一种解释型语言: 这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。
Python 是交互式语言: 这意味着,您可以在一个 Python 提示符 >>> 后直接执行代码。
Python 是面向对象语言: 这意味着Python支持面向对象的风格或代码封装在对象的编程技术。
Python 是初学者的语言:Python 对初级程序员而言,是一种伟大的语言,它支持广泛的应用程序开发,从简单的文字处理到 WWW 浏览器再到游戏。
Python 特点
1.易于学习:Python有相对较少的关键字,结构简单,和一个明确定义的语法,学习起来更加简单。
2.易于阅读:Python代码定义的更清晰。
3.易于维护:Python的成功在于它的源代码是相当容易维护的。
4.一个广泛的标准库:Python的最大的优势之一是丰富的库,跨平台的,在UNIX,Windows和Macintosh兼容很好。
5.互动模式:互动模式的支持,您可以从终端输入执行代码并获得结果的语言,互动的测试和调试代码片断。
6.可移植:基于其开放源代码的特性,Python已经被移植(也就是使其工作)到许多平台。
7.可扩展:如果你需要一段运行很快的关键代码,或者是想要编写一些不愿开放的算法,你可以使用C或C++完成那部分程序,然后从你的Python程序中调用。
8.数据库:Python提供所有主要的商业数据库的接口。
9.GUI编程:Python支持GUI可以创建和移植到许多系统调用。
10.可嵌入: 你可以将Python嵌入到C/C++程序,让你的程序的用户获得"脚本化"的能力。
认识数据分析
数据分析是大数据技术的重要组成部分。近年来,随着大数据技术的逐渐发展,数据分析技能被认为是数据科学领域中数据从业人员需要具备的技能之一。与此同时,数据分析师也成了时下最热门的职业之一.掌握数据分析技能是一个循序渐进的过程,明确数据分析概念、流程和应用场景等相关知识是掌握数据分析的第一步。
Jupyter Notebook(此前被称为 IPython Notebook)是一个交互式笔记本,支持运行 40 多种编程语言,本质上是一个支持实时代码、数学方程可视化和 Markdow 的 Web 应用程序。对于数据分析,Jupyter Notebook的优点是可以重现整个分析过程,并将说明文字、代码、图表、公式和结论都整合在一个文档中。用户可以通过电子邮件、Dropbox、GitHub 和Jupyter Notebook Viewer 将分析结果分享给其他人。
颜色在可视化中非常重要,可用于代表各种特征,并且提高整个图的观赏性。如果有效地使用颜色,那么可以显示数据中的图案;如果颜色使用不当,那么将会隐藏数据中图案。在seaborn中颜色由调色板控制,因此调色板是seaborn库中绘制图形的基础。常用于调色板的函数及其作用如表所示。
常用于调色板的函数及其作用
函数名称 | 函数作用 |
hls palette | 用于控制调色板颜色的亮度和饱和 |
xkcd_palette | 使用xkcd颜色中的颜色名称创建调色板 |
cubehelix_palette | 用于创建连续调色板 |
light_palette | 用于创建颜色从浅色到深色的连续调色板 |
dark palette | 用于创建颜色从深色到深色混合的连续调色板 |
choose_light_palette | 启动交互式小部件以创建浅色连续调色板 |
choose_dark_palette | 启动交互式小部件以创建深色连续调色板 |
diverging_palette | 用于创建离散调色板 |
choose_diverging palette | 启动交互式小部件选择不同的调色板,与diverging palette函数功能相对应 |
color_palette | 用于返回定义调色板的颜色列表或连续颜色图 |
set palette | 用于设置调色板,为所有图设置默认颜色周期 |
通常在不知道数据具体特征的情况下,是无法得知使用什么类型的调色板或颜色映射最优的。因此,将使用定性调色板、连续调色板和离散调色板3种不同类型的调色板,用于区分使用color_palette函数的不同情况。除此之外还可以使用set_palette函数将调色板设置为默认调色板。
(1)定性调色板
当需要区分没有固有顺序的离散数据区块时,定性(或分类)调色板是较佳先择。在导入seaborn 库后、默认颜色周期将更改为10种颜色
seabron默认颜色周期
sns.palplot(sns.color_palette())
默认颜色主题有deep、muted、pastel、bright、dark和colorblind等,默认为deep,导入不同颜色主题
palette = sns.color_palette('bright')
sns.palplot(palette)
在使用定性调色板时可对调色板进行调整,具体如下。