
数据分析
文章平均质量分 61
热心市民Daisy
这个作者很懒,什么都没留下…
展开
-
[利用python进行数据分析 书笔记]第3章 IPython:一种交互式计算和开发环境
内省 在变量的前面或后面加上一个问号(?)就可以将有关该对象一些通用信息显示 Type/String Form/Length/Docstring 也可以显示函数,使用(??)还可以显示出该函数的源代码 (?)还可以搜索IPython命名空间,搭配通配符(*)如np.*load*? %run命令 运行脚本,只需将文件名传给%run就可以运行。如%run test.py Ctrl-C 可用于...原创 2018-06-24 14:50:54 · 336 阅读 · 0 评论 -
[利用python进行数据分析 书笔记]第4章 NumPy基础:数组和矢量计算
NumPy的ndarray:一种多维数组对象创建ndarraydata.shape 表示各维度大小的元组 data.dtype 表示数组数据类型 data.ndim 返回维数 ndarray的数据类型astype 显式地转换其dtype,会创建一个新的数组(一份拷贝)数组和表量之间的运算两数组之间直接使用+、-、*、/基本的索引和切片arr[5:8] 数组切片是原始数组的视图(数据不会被...原创 2018-06-24 16:33:31 · 328 阅读 · 0 评论 -
[利用python进行数据分析 书笔记]第5章 pandas入门
pandas数据结构介绍Seriespd.Series([1,2,3] ,index = []) 创建一个带索引的一维数组 pd.Series(字典 ,index= []) 创建一个带索引的一维数组,可以通过index来修改索引,如修改后的索引不在字典中存在,该值为Na'N arr.values 获取数组数值 arr.index 获取数组索引对象 arr['a','b'] 通过索引方式...原创 2018-06-25 09:59:12 · 384 阅读 · 0 评论 -
[利用python进行数据分析 书笔记]第6章 数据加载、存储和文件格式
读取文本格式的数据逐块读取文本文件pd.read_csv(nrows = ) 只读取几行 pd.read_csv(chunksize = ) 逐块读取文件,根据chunksize对文件进行逐块迭代 将数据写出到文本格式pd.to_csv pd.from_csv 手工处理分隔符格式JSON数据import json json.loads() 将json字符串转换成python形式 json....原创 2018-06-25 19:40:42 · 363 阅读 · 0 评论 -
[利用python进行数据分析 书笔记]第8章 绘图和可视化
matplotlib API入门Figure和Subplot方法一: fig = plt.figure() 创建一个新的Figure,可通过figsize改变大小 ax1 = fig.add_subplot(2,2,1) 通过add_subplot创建一个或多个subplot ax1.hist() 然后可以在格子1中画图 方法二: fig, axes =plt.subplots(2,...原创 2018-06-26 10:14:48 · 411 阅读 · 0 评论 -
[利用python进行数据分析 书笔记]第7章 数据规整化:清理、转换、合并、重塑
合并数据集数据库风格的DataFrame合并索引上的合并merge参数上采用left_index和right_index join方法 在连接键上做做左连接,支持参数的索引和某个列之间的连接 left1.join(right1 , on ='key') 轴向连接pd.concat()合并重叠数据a.combine_first(b) 如果a不存在就用b补上重塑和轴向旋转重塑层次化索引sta...原创 2018-06-25 23:52:25 · 326 阅读 · 0 评论 -
[利用python进行数据分析 书笔记]第9章 数据聚合和分组运算
GroupBy技术对分组进行迭代 groupby对象支持迭代,可以产生一组二元元组(有分组名和数据块组成) for name,group in df.groupby('key') 选取一个或一组列 df.groupby('key1')['data1'] 等于 df['data1'].groupby(df['key1']) 以key1为目标分组出data1对应数据 通过字典或Seri...原创 2018-06-27 16:34:12 · 331 阅读 · 0 评论