
数据分析核心工具Pandas
多欢喜
漫漫长路,平凡一生
展开
-
Python数据分析数据可视化-----最好用的Pandas文件读取方法(持续更新中)
迟到的更新又来了~这篇博客写一下Pandas读取txt文件,excel文件和csv文件的方法(1)读取txt文件import osos.chdir('C:/Users/XXX/Desktop/')#加载工作路径data1 = pd.read_table('data1.txt', delimiter=',',header = 0, index_col=1)print(data1)读...原创 2020-04-12 10:49:46 · 1084 阅读 · 0 评论 -
Python数据分析数据可视化-----确实比较麻烦的Pandas分组转换及透视表交叉表(持续更新中)
昨天晚上写作业写到太晚了,所以今早来补上本来昨晚该发的博客~这篇博客首先写一下分组转换方法transform(1)数据分组转换----transform创建Dataframe,并按‘key1’分组求均值df = pd.DataFrame({'data1':np.random.rand(5), 'data2':np.random.rand(5), ...原创 2020-04-11 11:49:17 · 609 阅读 · 0 评论 -
Python数据分析数据可视化-----确实比较麻烦的Pandas数据分组工作(持续更新中)
这篇博客呢写一下Pandas数据分组实现方法很多时候我们需要对数据进行分组讨论,所以这篇博客对后面做数据分析真的还是蛮重要的,有必要好好看一下Pandas数据分组最常用的是groupby方法(1)分组创建DataFramedf = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar','foo', 'bar', 'foo', 'foo'], ...原创 2020-04-09 22:49:53 · 602 阅读 · 0 评论 -
Python数据分析数据可视化-----学了就会的Pandas数据去重及替换
最近期中考试来啦,所以更新也不是很及时了,但是没关系,更新可能会迟到,但不会缺席!这篇博客写一下数据的去重和替换以及数据分组(1)去重—.duplicated数据的去重就是去除数据中重复的部分,pandas中主要是通过duplicated来实现创建Series数据s = pd.Series([1,1,1,1,2,2,2,3,4,5,5,5,5])print(s)输出结果:判断是...原创 2020-04-09 10:25:58 · 520 阅读 · 0 评论 -
Python数据分析数据可视化-----非常基础却又非常有用的Pandas数据连接与修补工作
上一篇博文讲了怎样通过merge 和 join 合并数据,这一篇讲一下数据的连接与修补方法(1)连接–concat分为按行连接和按列连接,默认为按行连接生成Series数组s1 = pd.Series([1,2,3])s2 = pd.Series([2,3,4])s3 = pd.Series([1,2,3],index = ['a','c','h'])s4 = pd.Series([...原创 2020-04-07 21:12:39 · 306 阅读 · 0 评论 -
Python数据分析数据可视化-----一定要学会的Pandas数据合并方法
前面的博客写了Pandas中文本数据的处理方法,这篇博客来写一下数据的合并方法,做数据分析的话这部分还是蛮重要的,建议好好看一下Pandas具有全功能的,高性能内存中的连接操作,与SQL等数据库非常的相似(1)merge合并创建几个Dataframedf1 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'], ...原创 2020-04-06 22:46:12 · 462 阅读 · 0 评论 -
Python数据分析数据可视化--超级好用的的Pandas文本数据处理方法
更新可能会迟到,但不会缺席~~~这篇博客写一下Pandas处理文本数据的方法Pandas针对字符串配备了一系列的方法,使其易于对数组的每个元素进行操作(1)通过str访问s = pd.Series(['A','b','C','bbhello','123',np.nan,'hj'])#创建Series数据df = pd.DataFrame({'key1':list('abcdef'), ...原创 2020-04-06 11:21:03 · 505 阅读 · 0 评论 -
Python数据分析数据可视化--不想学也得学的Pandas数值计算和统计基础
前面几篇博客写了pandas的两种基本数据结构Series和Dataframe,其实pandas里面还有一个非常好用的模块是时间模块,但是这个模块一般用的不多,对学金融和会计的同学可能比较重要,其他行业用的应该不是很多,我就不写有关它的部分了,今天这篇呢写一下Pandas的数值计算和统计基础部分,主要是一些数学函数的使用(1)基本参数:axis、skipnaaxis参数默认为0,按列来计算,当...原创 2020-04-04 22:59:56 · 266 阅读 · 0 评论 -
Python数据分析数据可视化--看一眼就能学会的的Pandas数据结构DataFrame(下)索引
昨天事情实在是太多啦,忙完之后都十一点钟了,所以就没有继续更新了,没关系,今天早上只有一节课,抽时间把昨晚的补上哈哈O(∩_∩)O哈哈~今天呢继续写一下Pandas数据结构里面的Dataframe,上一篇博客介绍了基本概念和创建方法,这篇呢写一下它的索引。Dataframe 是一个二维数组,所以既有行索引也有列索引,我们来看一下怎样选择行与列df = pd.DataFrame(np.rando...原创 2020-04-03 11:01:35 · 231 阅读 · 0 评论 -
Python数据分析数据可视化--看一眼就能学会的的Pandas数据结构DataFrame(上)
前面两篇博客写了一维数组Series,接下来再来写写二维数组DataFrame,DataFrame是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值、字符串、布尔值等,它的数据以一个或多个二维块存放,不是列表、字典或一维数组结构。(1)Dataframe数据结构Dataframe数据结构是一个表格型的数据结构,是带有标签的二维数组,带有行标签(index)和列标签(columns...原创 2020-04-01 22:28:35 · 738 阅读 · 0 评论 -
Python数据分析--你不得不会的Pandas数据结构Series(下)
前面讲了Pandas中Series的基本数据结构,创建方法以及索引等基本知识,今天我们再来讲一下Series的基本技巧(1)查看数据查看Series的数组可以从头开始查看也可以从末尾开始查看s = pd.Series(np.random.rand(50))#创建Series数据print(s.head(10))#查看前10个数据print(s.tail())#查看后5条数据输出结果:...原创 2020-03-31 22:36:12 · 195 阅读 · 0 评论 -
Python数据分析--你不得不会的Pandas数据结构Series(上)
从最开始的Python基础语言,到前几天的Numpy模块,其实前面所有的东西都是在为Pandas模块做准备。Pandas是数据分析核心工具包,基于Numpy构建,为数据分析而存在!Pandas模块包括一维数组Series和二维数组DataFrame,可以直接读取数据并处理,高效且简单,这个模块兼容各种数据库,支持各种分析算法,话不多说,我们今天首先来看一维数组SeriesSeries是带有标签...原创 2020-03-30 21:57:07 · 365 阅读 · 0 评论