数据分析
coolerpan
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
seaborn palette参数各配色方案及显示效果
使用方法:以采用Paired_r配色方法为例,通过调用barplot(palette='Spectral_r')来使用配色Paired_rAccentAccent_rBluesBlues_rBrBGBrBG_rBuGn、BuGn_rCMRmap、CMRmap_rDark2Dark2_rGreens、Gr...原创 2020-01-06 10:51:50 · 23184 阅读 · 2 评论 -
python数据分析——北京房价分析
数据集及源代码链接:https://github.com/roberpan/python/tree/master/test/dataanalyse/houseprice一、统计北京各区二手房单价排名,并分析高端小区(排名前10/50/100的小区),各区占有量# -*- coding: utf-8 -*-# 根据安居客数据来源,对二手房信息进行统计import pandas as ...原创 2020-01-03 15:49:37 · 2482 阅读 · 0 评论 -
pandas分组聚合实例
文中所用数据来源:https://github.com/wesm/pydata-book/tree/2nd-edition/examples/tips.csvimport pandas as pdimport numpy as nppd.set_option('display.max_columns', None) #显示所有列content=pd.read_csv('data/...原创 2019-12-25 11:19:23 · 613 阅读 · 0 评论 -
pandas groupby学习2——聚合
'''groupby 聚合练习'''import pandas as pdimport numpy as npdf = pd.DataFrame({'key1' : ['a', 'a', 'b', 'b', 'a'], 'key2' : ['one', 'two', 'one', 'two', 'one'], ...原创 2019-12-23 17:47:23 · 264 阅读 · 0 评论 -
pandas groupby学习1——分组
'''groupby 分组学习'''import pandas as pdimport numpy as npdf = pd.DataFrame({'key1' : ['a', 'a', 'b', 'b', 'a'], 'key2' : ['one', 'two', 'one', 'two', 'one'], ...原创 2019-12-20 14:24:17 · 385 阅读 · 0 评论 -
pandas数据分析案例1
"""本程序实现对movies文件夹中,影评人数据的统计分析功能"""import pandas as pdpd.options.display.max_rows=10 #设置可显示的数量unames=['user_id', 'gender', 'age', 'occupation', 'zip']users=pd.read_table('movies/users.dat',s...原创 2019-12-11 09:27:52 · 406 阅读 · 0 评论 -
pandas groupby常用操作
import pandas as pdimport numpy as npindex=pd.Index(data=["Tom", "Bob", "Mary", "James", "Andy", "Alice"],name='name')data = { "age": [18, 30, 35, 18, 22, 30], "city": ["Bei Jing ", "Shan...原创 2019-12-09 09:04:04 · 818 阅读 · 0 评论 -
Python apply函数运用
1、介绍apply函数是pandas里面所有函数中自由度最高的函数。该函数如下:DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds)该函数最有用的是第一个参数,这个参数是函数,相当于C/C++的函数指针。这个函数需要自己实现,函数的传入参数根据axis来定,比如a...转载 2019-12-06 10:52:10 · 452 阅读 · 0 评论 -
用雅虎财经进行股票数据分析
#-*- coding:utf-8 -*import pandas as pdimport numpy as npfrom pandas_datareader import dataimport matplotlib.pyplot as pltstock_codes=['AAPL', 'IBM', 'MSFT', 'GOOG']start_date='2019-01-01'end...原创 2019-11-29 08:59:16 · 527 阅读 · 0 评论 -
pandas索引和行列选取总结
pandas的数据格式最常用的为Series和DataFrame两种类型,以下分别对两种类型的索引和数据选取方式进行了总结整理。1、Series格式Series格式很简单,只有两列,一列索引,一列为值,按照是否自定义索引类型,分为两种情况进行讨论:1)默认索引类型,即由系统自动添加从0开始按序增加的索引import pandas as pdser=pd.Series(['Oh...原创 2019-04-30 16:55:22 · 27255 阅读 · 1 评论 -
关于pycharm中同级目录下无法导入自己写的模块的解决办法
今天在用pycharm第一次导入自己写的模块时,发现即便在同级目录下,不能进行导入。网上搜了好久,都只介绍了导入不同级目录下的模块的方法。不过最后还是找到了正确的方法,如下所示。1.打开"File"->Settings->打开 “Build,Execution,Deployment”下的Console下拉表,选择“Python Console”,把选项(Add source roo...转载 2019-04-19 17:45:02 · 5530 阅读 · 4 评论
分享