
Python数据处理
文章平均质量分 80
图图酱
这个作者很懒,什么都没留下…
展开
-
Python数据分析示例(2)Day3
说明:本文章为Python数据处理学习日志,主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。电影数据分析所需文件在Day2中下载,接下来要用到的一些文件的文件格式如下:users.dat文件格式1::F::1::10::480672::M::56::16::700723::M::25::15::55117ratings.dat文件格式1::119原创 2016-05-07 11:38:14 · 4969 阅读 · 2 评论 -
Python番外(3)——P72性能分析
首先将下列代码保存到cprof_example.py文件:import numpy as npfrom numpy.linalg import eigvals'''函数'''def run_experiment(niter = 100): K = 100 results = [] for _ in xrange(niter): mat = np.rando原创 2016-09-17 15:49:20 · 662 阅读 · 0 评论 -
第八章:绘图和可视化
说明:本文章为Python数据处理学习日志,记录内容为实现书本内容时遇到的错误以及一些与书本不一致的地方,一些简单操作则不再赘述。日志主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。这篇博文主要是为了补全python处理数据系列,所以写的比较简略,并没有太多代码,主要说明一下这一章可能会遇到的几个问题。1、P242的三个绘图函数Rectangle的三个参原创 2016-09-17 16:44:32 · 1256 阅读 · 2 评论 -
第七章:数据规整化
说明:本文章为Python数据处理学习日志,记录内容为实现书本内容时遇到的错误以及一些与书本不一致的地方,一些简单操作则不再赘述。日志主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。这篇博文主要是为了补全python处理数据系列,基本上本章没有太多的问题,主要就是P202的数据作者并没有给出,手动编辑csv太麻烦,接下来介绍如何用代码将macrodata原创 2016-09-17 18:00:32 · 1342 阅读 · 0 评论 -
python番外(1)——matplotlib中文显示问题
Ubuntu下Canopy matplotlib不显示中文的解决方法。推荐方法二,一劳永逸!方法一步骤一:下载一个中文字体,如msyh.ttf,拷贝到指定文件夹$ sudo cp msyh.ttf /usr/share/fonts/truetype/步骤二:在Canopy代码中设置字体zhfont = mpl.font_manager.FontProperties(fname='/usr/share原创 2016-08-03 10:12:22 · 2073 阅读 · 0 评论 -
python番外(2)——Basemap安装
Ubuntu下安装Basemap包,第八章及后续内容会用到此包。步骤一:下载basemap.tar.gz如下网址: https://sourceforge.net/projects/matplotlib/files/matplotlib-toolkits/ 下载想要的版本。 到目录下解压:$ tar zxvf basemap-1.0.7.tar.gz步骤二:安装GOES library如果已安原创 2016-08-12 16:06:42 · 10156 阅读 · 3 评论 -
第九章:数据聚合与分组运算
说明:本文章为Python数据处理学习日志,记录内容为实现书本内容时遇到的错误以及一些与书本不一致的地方,一些简单操作则不再赘述。日志主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。3、分组级运算和转换P285示例pct_change() Signature: DataFrame.pct_change(self, periods=1, fill_me原创 2016-08-22 15:22:15 · 890 阅读 · 0 评论 -
第六章:数据加载、存储于文件格式Day12-14
说明:本文章为Python数据处理学习日志,记录内容为实现书本内容时遇到的错误以及一些与书本不一致的地方,一些简单操作则不再赘述。日志主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。原创 2016-07-31 15:13:42 · 3166 阅读 · 0 评论 -
第三章:IPython交互式开发环境Day5
说明:本文章为Python数据处理学习日志,记录内容为实现书本内容时遇到的错误以及一些与书本不一致的地方,一些简单操作则不再赘述。日志主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。魔术命令%resetDocstring:Resets the namespace by removing all names defined by the user, if原创 2016-05-09 18:57:01 · 2419 阅读 · 0 评论 -
第五章:pandas入门Day8-11
说明:本文章为Python数据处理学习日志,记录内容为实现书本内容时遇到的错误以及一些与书本不一致的地方,一些简单操作则不再赘述。日志主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。1、pandas的数据结构Series Init signature: Series(self, data=None, index=None,原创 2016-07-24 08:33:29 · 4606 阅读 · 1 评论 -
第四章:NumPy基础Day6-7
说明:本文章为Python数据处理学习日志,记录内容为实现书本内容时遇到的错误以及一些与书本不一致的地方,一些简单操作则不再赘述。日志主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。1、ndarrayndarray介绍ndarray的说明: Class docstring: ndarray(shape, dtype=float, buffe原创 2016-07-21 15:49:02 · 2745 阅读 · 0 评论 -
Python数据分析示例(3)Day4
说明:本文章为Python数据处理学习日志,主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。1880-2010年间全美婴儿姓名所需文件在Day2中下载,接下来要用到的一些文件的文件格式如下:yob1880.txt-yob2010.txtMary,F,7065Anna,F,2604Emma,F,2003整合数据可以看到.txt文件中各个记录字段都以都原创 2016-05-08 17:27:50 · 12720 阅读 · 2 评论 -
准备工作Canopy安装Day1
说明:本文章为Python数据处理学习日志,全部内容均来自书本,参考书本为《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。安装和设置作者推荐Python安装包为ENthought Python Distribution(现更名Enthought Canopy),译本发行时间距现在有2年时间,所以期间有版本更新,译者建议下载书中提到的安装包版本epd_free_7.3-1原创 2016-05-06 12:59:32 · 3119 阅读 · 0 评论 -
Python数据分析示例(1)Day2
说明:本文章为Python数据处理学习日志,主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。“以我的观点来看,如果只需要用Python进行高效的数据分析工作,根本就没必要非得成为通用软件编程方面的专家不可。”——作者接下来是书本一些代码的实现,用来初步了解Python处理数据的功能,相关资源可在下方链接下载。 书本相关资源读取文件第一行相关例子可以再s原创 2016-05-06 16:56:27 · 11424 阅读 · 3 评论