
Python
进击的可乐!
公众号【可乐的数据分析之路】。出版书《Excel数据处理与分析——数据思维+分析方法+场景应用》
展开
-
从Excel的数据类型说Python
写在前面这节内容是python基础知识中的数据类型和运算符,可以回顾一下前两篇文章来复习一下:利用Excel学习Python:变量利用Excel学习Python:准备篇本来想分开写的,但发现好像分不开,所幸内容也不多,废话不多说,直接正文怼上来。Excel中有3种基本的数据类型:数值型、字符型和逻辑型,在python中也不例外,我们可以一一对应来看。1.数值型先来想一下Excel中的数值类型的数据是什么样的,数字、百分数、分数、小数、货币、科学计数、日期和时间这些单元格格式都是数值型的数据,只是原创 2020-12-16 16:38:21 · 512 阅读 · 0 评论 -
用python给男朋友写的小程序
七夕将至,给男朋友写了个小程序,把他感动哭了,把我可累惨了。可乐我也不是程序媛专门敲代码的,虽然也学过,但也仅局限于用pandas处理一下数据的程度,要写一个界面并且能让对方直接打开,有点超纲。但是经过5天的不懈努力,终于也算写出来了,就长下面这个样子,其实就是Python里用tkinter模块做的一个GUI图形界面。(文末有原码获取方式)这其实是一个悲伤的故事,请看到最后。tkinter做的GUI图形界面登陆界面,输入账号密码点击照片登陆。登陆界面密码输入错误则出现以下弹原创 2020-12-16 16:53:03 · 1882 阅读 · 3 评论 -
Python数据分析:探索性分析
写在前面如果你忘记了前面的文章,可以看看加深印象:Pandas数据处理Python数据分析实战:缺失值处理Python数据分析实战:获取数据然后可以进入今天的正文一、描述性统计分析Excel里可以用【数据分析】功能里的【描述统计】功能来查看数据集常用的统计指标,但这里只能是对数值型的数据进行统计。pandas里可以用describe方法对整个数据集做一个描述性统计分析,...原创 2020-05-16 10:21:07 · 1026 阅读 · 0 评论 -
Python数据处理
一、查找重复值既然我们这个系列是对比Excel,那么在Excel里是怎么查找重复值的呢?有很多种方法,这里就简单说一种:条件格式。在【开始】——【条件格式】里选择突出显示重复值,就将重复的值突出显示出来了:Pandas里如何查找重复值呢?1、查找所有列duplicated方法查找重复值,和isnull一样,得到的结果是布尔值,如果重复被标记为True,否则为Fal...原创 2020-05-04 20:07:59 · 5004 阅读 · 1 评论 -
Python数据分析:缺失值处理
写在前面上周我们读取完了数据(Python数据分析实战:获取数据),下面就要对数据进行清洗了,首先是对缺失值的处理。缺失值也就是空值,先找出来再处理。查看缺失值可以使用isnull方法来查看空值,得到的结果是布尔值。#查看缺失值df_list.isnull()结果:对于小的数据集来说,可以这样看,但对于大的数据集这样查看空值貌似没什么意义,没关系,还有其他...原创 2020-04-25 11:05:35 · 2427 阅读 · 0 评论 -
Python数据分析实战:获取数据
这是 利用Excel学习Python 系列的第8篇文章想用一个完整的案例讲解Python数据分析的整个流程和基础知识,实际上以一个数据集为例,数据集是天池上的一个短租数据集。先来想一下数据分析的流程,第一步获取数据,因此本节内容就是获取数据以及对数据的基本操作。1.数据导入1.1 导入.xlsx文件要导入一个.xlsx后缀的Excel文件,可以使用pd.read_excel...原创 2020-04-18 20:46:10 · 981 阅读 · 0 评论 -
Python学习笔记(7):数据框
前一篇文章提到了序列,可以理解为Excel里没有列名的一列数据,那么Excel里的由行列组成的表数据是如何对应到Python中的呢?就是今天要说的数据框:DataFrame。它是由一组数据和一对索引(行索引和列索引)组成的二维数据结构,可以看成Excel里的表格,与Series不同的是,DataFrame可以有多行/列数据。1.建首先要导入pandas模块,简写为pd。In[1...原创 2020-04-04 15:30:39 · 1206 阅读 · 0 评论 -
Python学习笔记(6):序列
写在前面Hello,大家好,我是可乐。这是Python数据分析系列的第5篇文章,今天要说的是数据结构中的序列(Series),Series是由一组数据和一组行索引构成的一维数组,可以理解为Excel里没有列名的一列数据。要使用Series,就要导入pandas模块。importpandasaspd1. 建新建一个Series,用pd.Series,可以从列表中创建...原创 2020-03-23 20:10:15 · 150 阅读 · 0 评论 -
Python学习笔记(2)
写在前面这节内容是python基础知识中的数据类型和运算符,可以回顾一下前两篇文章来复习一下:利用Excel学习Python:变量利用Excel学习Python:准备篇本来想分开写的,但发现好像分不开,所幸内容也不多,废话不多说,直接正文怼上来。Excel中有3种基本的数据类型:数值型、字符型和逻辑型,在python中也不例外,我们可以一一对应来看。1.数值型先来想一下Ex...原创 2020-03-21 14:09:27 · 540 阅读 · 0 评论 -
Python学习笔记(5):字典
写在前面本系列适合0基础的人食用,这是利用Excel学习Python系列的第5篇文章,系列文章可移步:Python数据分析(点击标题可查看)之前的列表都复习好了吗:python数据结构:列表are u ready?另一种数据结构:字典,要来了字典(dict),是用大括号{}括起来的一种键值对的数据结构,字典通常这样表示:字典名= {key1:value1,key2,valu...原创 2020-03-16 20:22:18 · 258 阅读 · 0 评论 -
Python学习笔记(3):列表
写在前面这节内容是Python基础知识中的数据结构,没看过前面内容的童鞋可以复习一下:从Excel的数据类型说Python数据结构会分4个小节的内容来写,首先来认识第一种结构——列表。列表(list),是用方括号[]括起来的一种数据结构,元素和元素之间用逗号分隔,列表中的元素是可以进行增删查改等一系列操作的,列表通常这样表示:列表名 = [元素1,元素2,元素3]我们从...原创 2020-03-15 11:10:39 · 396 阅读 · 0 评论 -
python学习笔记(2):变量
变量,从名称就可以理解,变化的量,与之相对的是常量,就是不会改变的量。1.变量变量有两个要素,变量名和值,变量一般这样表示:变量名 = 值,我们把变量名叫做标识符,变量名不是随便起的,要遵循以下原则: 以字母或下划线,由字母、数字、下划线组成。意思是不能以数字开头作为变量名 不能用python里的关键字作为变量名 长度不能超过255个字符 注: 变...原创 2020-03-11 20:14:47 · 996 阅读 · 0 评论 -
pandas学习笔记(1):准备篇
工欲善其事必先利其器,在正式进入python学习前,我们需要进行一些准备,包括python的下载与安装,常用的IDE,以及最后选择一个IDE进行练习。1.Pandas和PythonPython是胶水语言,学习时要有所取舍。对于有用python进行数据分析需求的人来说,我们至少需要学习python中的pandas,这个句子里有两个关键词,至少和pandas,先来说pandas。...原创 2020-03-10 22:02:15 · 290 阅读 · 0 评论