
Python 科学编程
文章平均质量分 87
本专栏主要介绍:Python 编程基础,numpy, pandas, matplotlib 等科学计算库,字符编码处理,数据分析,多进程并行运算和一些我平时在项目中总结的一些个人经验。
永永夜
good good study, day day up!
展开
-
numpy 常用操作
numpy提供了ndarray和matrix两种类型的数据,为我们进行科学运算提供了非常便捷的运算工具。相对来说,我觉得其实还是MATLAB对于矩阵运算的支持更加直观易操作,但是作为Python使用者,怎能不把numpy用熟用透呢。在numpy中,同样一种操作可能提供了很多种不同的方式,具体怎么来实现完全是使用者个人习惯。对于和我一样的菜鸟,我觉得最好是从一开始就养成较好的操作习惯。numpy的二维原创 2017-02-10 12:37:17 · 4368 阅读 · 0 评论 -
ipython notebook使用教程
最近在使用jupyter notebook,感觉非常舒爽。特别是在本地的浏览器上就可以利用jupyter实现在服务器上编程,更是爽歪歪了。关于如何实现本地浏览器上进行服务器上编程参照了这篇文章:Ubuntu环境下Anaconda安装TensorFlow并配置Jupyter远程访问.另外,亲测发现ipython运行速度比使用pycharm快(这是为什么呢?)***转载 2016-11-21 00:05:32 · 24596 阅读 · 0 评论 -
pymongo 和 xpath 基本操作
@creat_data: 2017-05-01 @author: huangyongye前言: 相信有不少人和我一样,最开始学习 python 就是为了写个爬虫脚本从网上抓数据。第一次从网页上抓取信息的感觉很爽。那时候用得最多的莫过于正则表达式,但是很久没用,基本也都忘光了。后来学习了 xpath 神器,简直所向披靡,比正则方便多了。对于文本数据,抓取下来后存在 mongodb 中是个很不错的选择原创 2017-05-07 11:19:16 · 1270 阅读 · 0 评论 -
Python+不同的数据存储方式比较
本文来探索一下python中提供的各种数据保存格式的性能如何。主要以一个 ndarray 格式的数据进行处理分析。包括下面几种方式:.bin格式, tofile() 和 fromfile().npy格式,save() 和 load().txt 或者 .csv格式,savetxt() 和 loadtxt().h5 文件.pkl 文件import numpy as npfrom __fut原创 2017-07-03 17:26:37 · 14694 阅读 · 3 评论 -
linux下python的文件路径操作
1.如何在linux下通过import来导入自定义的模块2.关于os.path的使用原创 2016-09-26 22:50:58 · 16339 阅读 · 0 评论 -
pandas apply 函数 多进程实现
@creat_data: 2017-05-08 @author: huangyongye 前言: 在进行数据处理的时候,我们经常会用到 pandas 。但是 pandas 本身好像并没有提供多进程的机制。本文将介绍如何来自己实现 pandas (apply 函数)的多进程执行。其中,我们主要借助 joblib 库,这个库为python 提供了一个非常简洁方便的多进程方法。所以,本文将按照下面的原创 2017-05-08 17:13:36 · 18882 阅读 · 1 评论